轉(zhuǎn)帖|行業(yè)資訊|編輯:龔雪|2017-02-16 10:21:00.000|閱讀 230 次
概述:每天在網(wǎng)上看見無腦噴和低級(jí)黑是否極大影響了你的心情?維基百科與谷歌正聯(lián)手開發(fā)新的黑科技,還你一個(gè)干凈的網(wǎng)絡(luò)環(huán)境。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
最近,來自維基百科和谷歌的 IT 專家,公布了把 AI 用于“節(jié)制”維基百科用戶評(píng)論的成果——找出哪些用戶在搞人身攻擊,還有他們?yōu)槭裁匆诰W(wǎng)上罵街。針對(duì)該問題,研究人員開發(fā)機(jī)器學(xué)習(xí)算法,分析維基百科在 2015 年收到的的海量評(píng)論。這一年,維基百科討論頁面共收到 6300 萬條評(píng)論。這些評(píng)論存在的本意,是討論如何改進(jìn)維基百科收錄的各條文章。
這些算法使用 10 萬條包含侮辱性言辭的評(píng)論以進(jìn)行訓(xùn)練,當(dāng)然,這樣的樣本規(guī)模只能算是偏小的。起初,十名人類員工對(duì)這些評(píng)論進(jìn)行分類,以明確用戶評(píng)論中都出現(xiàn)了哪些人身攻擊語言方式。舉個(gè)例子,該機(jī)器學(xué)習(xí)算法能區(qū)別直接人身攻擊(比如“你是個(gè)XX”),第三方人身攻擊(張三是個(gè)XX),以及間接人身攻擊(“張三說李四是XX”)
研究成果以論文形式發(fā)表出來,題目為'Ex Machina: Personal Attacks Seen at Scale'(Ex Machina:大規(guī)模人身攻擊)。該論文將在四月份澳大利亞珀斯舉行的的世界互聯(lián)網(wǎng)大會(huì)上展出。
34 名用戶“貢獻(xiàn)”了 9% 的網(wǎng)上謾罵
橫坐標(biāo)軸:總發(fā)帖數(shù);豎軸:侮辱性言論比值;黑色:匿名用戶;藍(lán)色:注冊(cè)用戶
如上圖,匿名用戶發(fā)布人身攻擊言論的概率,比注冊(cè)用戶高六倍。但發(fā)表最多侮辱性言論的,卻是一小撮活躍注冊(cè)用戶。
該分析表明,維基百科 43% 的發(fā)表言論來自匿名用戶。這些人中的絕大部分并不經(jīng)常發(fā)帖,有的就只發(fā)過一次。但平均發(fā)表臟話概率比注冊(cè)用戶高六倍。但據(jù)雷鋒網(wǎng)了解,維基百科注冊(cè)用戶比匿名評(píng)論用戶多 20 倍,意味著超過半數(shù)的人身攻擊言論仍是注冊(cè)用戶發(fā)表的。
研究人員發(fā)現(xiàn),大多數(shù)情況下用戶言論是得體的。80% 的人身攻擊來自于 9000 多名用戶,而這一群體發(fā)侮辱性帖子的平均次數(shù)少于五次。意味著大多數(shù)人只在被激怒后,才開始在網(wǎng)上罵街。
但是,有一個(gè)包含 34 名活躍用戶的小群體。研究人員對(duì)該群體的打分是“危害指數(shù)超過 20”。這 34 個(gè)人竟然貢獻(xiàn)了維基百科全部侮辱性言論的近十分之一,準(zhǔn)確來說,是 9%。
很明顯,這些人就是網(wǎng)絡(luò)世界里所謂的“罵街黨”——那些喜歡上網(wǎng)和人罵戰(zhàn),把人身攻擊作為日常宣泄、娛樂活動(dòng)的人?,F(xiàn)在的好消息是,新的機(jī)器學(xué)習(xí)算法使得維基百科在用戶群中找出這些人變得更加容易,然后只需要把這幾個(gè)人的賬戶封掉,就能一下子減少論壇上 9% 的惡意言論。太劃算了,是不是?這意味著偶爾發(fā)表人身攻擊言論的普通用戶不必被封號(hào)——大多數(shù)只在和人吵起來之后才開罵。這還意味著,維基百科不需要像拉網(wǎng)一樣把全部評(píng)論篩一遍,用機(jī)器學(xué)習(xí)檢測(cè)侮辱性言辭,而只需把精力放在管理這些極少數(shù)的罵街黨上。
論壇維護(hù):人+AI
網(wǎng)上罵戰(zhàn),有時(shí)像野火一樣被瞬時(shí)點(diǎn)著。正因如此,相比能自動(dòng)決定該屏蔽哪個(gè)論壇用戶的計(jì)算機(jī)程序,有時(shí)候人類管理員更有用。
論文作者們?cè)诮Y(jié)論中說道:
“這些結(jié)果說明,圍繞著人身攻擊行為的一系列問題并不好解決。但我們的研究證實(shí),目前只有不到五分之一的人身攻擊行為,會(huì)觸發(fā)維基百科違規(guī)程序。”
未來,AI 大概會(huì)在網(wǎng)站評(píng)論管理中起到越來越大的作用。研究人員指出,能自動(dòng)篩選評(píng)論的系統(tǒng)可發(fā)揮極大的輔助作用——人類管理員能更清晰地把握用戶談話的健康狀況,并可以更快得發(fā)現(xiàn)“有毒”評(píng)論內(nèi)容,在引發(fā)更多用戶反感之前采取措施。(稿源:)
更多行業(yè)資訊,更新鮮的技術(shù)動(dòng)態(tài),盡在。
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn