精華文章文字探勘(text mining)將成為未來民意調查的主流方式

精華文章文字探勘(text mining)將成為未來民意調查的主流方式

17319660_01-998x550

台灣民意調查的發展至今已有50年,各種民意調查的結果,透過媒體的宣傳,已貼近一般大眾的生活,甚至影響著大眾的各種決策行為。民意調查的方式也持續改良中,但仍不脫尋找對象並求其回饋資訊的方式。近年來文字探勘技術的成熟,開始可以大量擷取、分析非結構化資料,利用網路資源作為民意調查的原始資料,已成為可思考的方向。

國內民意調查方式的演進

台灣最早的民調可追溯至1952年,當時台北新生報針對政府處理對日和約談判的議題,將問卷夾在報紙中共發出約28萬份,在一週後約回收5萬8千份,經統計分析後,透過具有公信力的人物背書,最後才將結果公佈。

現在台灣有許多專門的民意調查中心,像是選舉民調中心、消費品牌的民調中心等等,採取傳統問卷發放與訪談等方式,專司各種民意調查;而網路民調的網站也持續發展中,但主要的方式仍像傳統的問卷,只是改為數位版的問卷,而對象也僅限於網路使用者。

文字探勘技術(text mining),在這幾年內技術越臻成熟,除了將文本資料擷取至資料端,也包含以語意分析技術判別資料內容的屬性,分析的誤差已在可接受範圍內;國內從2012年開始,Big Data的話題持續發燒,許多應用也隨之而生,尤其這幾年Facebook、Plurk的興起,加上手機網路的盛行,使用者可以隨時隨地的發表自己的意見,試想,網路使用者將各種不同的意見資訊,主動放在網路的Big Data之中,而我們只要利用自動化的技術,就可以把這些非常大量的資訊,轉為我們想要的調查分析,這為文字探勘技術的應用,帶來了無限的可能性。

舉例來說,使用者在Facebook上發表一篇言論,是有關讚美iphone與抱怨三星的資訊,我們就可以利用語意分析的技術,計算這篇文章關於iphone的正面分數有多少,三星的負面分數又有多少,當樣本數越來越大時,所統計分析的資料就會接近普查的結果,即可以馬上找到類似「iphone與三星手機正負面評價調查」的答案。

OpView運用於民意調查與選舉預測

意藍科技近年來不斷開拓文字探勘的技術領域,OpView雲端平台即為Big Data運用之下的產物,將網路上大量的資訊擷取,進行分析、索引之後,使用者只要使用瀏覽器,就可以透過雲端獲取經過整理分析的資訊。

民意調查向來是預測選舉結果最重要的方式,2011年,OpView團隊利用文字探勘技術,擷取立委選舉相關的網路資料,並以內容分析技術,將文字情緒換算為分數,經過加權統計後,以其分數預測最後的選舉結果,其準確率可高達86.36%;相較於未來事件交易所2008年立委選舉的預測結果,最高僅為85%,表示利用文字探勘預測選舉結果是未來可發展之方向。

利用文字探勘進行民意調查,其最大的優勢在於節省成本,並可快速即時的取得網路資料,或可進一步針對資料來源進行政治傾向的加權計算,以調整選舉預測的準確度,其特點勢必將取代或結合目前主流的民意調查方法。

除了選舉預測外,同樣可針對各種品牌進行整體調查。OpView於2012年5月擔任數位時代所舉辦的「數位服務力大調查」評審,以文字探勘方式計算200家企業的網路聲量、正負面口碑數,進而統計而計算出各企業的「網路口碑影響力」分數,最後作為「數位服務力大調查」排名的指標之一。

OpView在民意調查的應用上已有先前的經驗,未來OpView也將提供民意調查與選舉預測的應用服務,若您想要更深入瞭解「民意調查」的應用模式,歡迎與我們聯繫(來信service@opview.com.tw,或電洽:02-27551533),我們將竭誠為您服務。