每日經(jīng)濟新聞 2016-10-21 00:35:46
每經(jīng)編輯|每經(jīng)記者 左越
◎每經(jīng)記者 左越
近期,由每日經(jīng)濟新聞主辦的“2016中國上市公司口碑榜”,攜手獨家輿情大數(shù)據(jù)服務提供商慧科訊業(yè),共同發(fā)布了中國資本市場首份輿情大數(shù)據(jù)榜單——2016上市公司輿情榜,獲得業(yè)內(nèi)各方的廣泛認可與關(guān)注。
值得一提的是,未來最終登上“2016中國上市公司口碑榜”9大榜單的獲獎公司,也將從輿情榜單排名靠前的400位公司名單中產(chǎn)生。
那么,這份萬眾矚目的輿情榜單是如何出爐的?背后又隱藏著怎樣的故事?今日,每日經(jīng)濟新聞為您揭秘,這一份含金量十足的榜單,究竟是怎樣出爐的。
總體來說,2016上市公司輿情榜通過梳理多達250萬條的海量輿情信息,并通過十大嚴謹?shù)牟襟E和指數(shù)計算公式的反復推敲,來確保輿情榜單的客觀與公正。
一、新聞大數(shù)據(jù)積累:
慧科訊業(yè)每天24小時全網(wǎng)監(jiān)測主流中文媒體,在數(shù)據(jù)庫中不斷積累海量的新聞大數(shù)據(jù)。
二、媒體信源確定:
根據(jù)慧科訊業(yè)科學的媒體評級,選定了國內(nèi)100份最重要的財經(jīng)類或綜合新聞類媒體,作為本次評選的信源。
三、原始新聞回溯:
慧科訊業(yè)研發(fā)部根據(jù)慧科訊業(yè)內(nèi)部的上市公司關(guān)鍵詞表,從過去一年的指定100家媒體的海量大數(shù)據(jù)中回溯相關(guān)新聞約250萬條。
四、新聞屬性判斷標準確定:
從經(jīng)營狀況是否良好、行業(yè)地位、是否遵紀守法、大股東是否信守承諾、獲得哪些榮譽等方面,來確定了每條新聞正面、負面、中性的判斷標準。
五、人工先行判斷部分新聞(輔助AI學習):
隨機抽取部分新聞,供資深財經(jīng)編輯根據(jù)相關(guān)標準對6000條新聞樣本進行人工標注(正面、負面、中性),供機器學習。
六、AI(人工智能)學習:
AI根據(jù)人工判斷新聞的素材進行學習,不斷調(diào)整模型和算法,最終達到理想的準確率和召回率水平。
七、AI大批量判斷:
AI機器對250萬條上市公司相關(guān)新聞進行自動判斷(正面、負面、中性),并對機器感到困惑的新聞打上相應的標簽。
八、人工調(diào)整:
人工對于標簽有疑問的新聞進行重點檢查,從而完成所有新聞的正面負面中性判斷。
九、確定指數(shù)計算標準并排名:
慧科訊業(yè)公司媒體管理總監(jiān)王勤介紹,我們結(jié)合媒體評級、新聞總量、正負面凈好評比等參數(shù),制定輿情榜指數(shù)計算標準,按此方式進行運算和排名。
簡單地說,根據(jù)2800多家上市公司在2015年8月1日~2016年9月18日這段時間在主流財經(jīng)媒體上的新聞報道來計算和排名的,一家上市公司的正面報道量越多,負面報道量越少,那么排名就越靠前。但只計算凈好評率還不夠,我們引入了新聞量這個因子,讓每家公司的新聞報道量也發(fā)揮作用。在計算過程中我們要做一些統(tǒng)計方面的處理,例如會涉及到對數(shù)標準化、參數(shù)權(quán)重、以及將計算結(jié)果換算成100以內(nèi)的數(shù)字的映射處理等,最終形成一份完整有價值的榜單。
十、榜單提交及后續(xù)追蹤:
未來,慧科訊業(yè)還將持續(xù)跟蹤輿情,如有入選公司發(fā)生重大負面,將及時對2016上市公司輿情榜進行調(diào)整。
正是經(jīng)過250萬條海量輿情信息的科學計算,以及上述十大嚴謹步驟的篩選后,2016上市公司輿情榜最終出爐。接下來,輿情榜中排名靠前的400家公司,將經(jīng)過南開大學中國公司治理研究院投資者關(guān)系管理研究團隊所建立的科學評價模型篩選,以及百家頂級機構(gòu)的審慎投票,最終誕生“2016中國上市公司口碑榜”九大榜單,135家獲獎公司。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP