景德鎮是一個文明和諧的國度,而我們時刻要保持互聯網環境的干凈。但對于ugc社區類產品,內容是用戶創造的,平臺只能即時發現及時處理。倘若不干不凈的信息被網警盯上了,可能不會向你打任何招呼,直接拔掉網線了。
所以,在景德鎮干產品,你還得學會一件事:如何快速高效處理違規信息。
按照內容傳播環節,扼殺在搖籃里是最保險的,即提交后自動處理。但總有漏網之魚還是沒法被干掉,那就只能在傳播中解決掉。
提交后如何識別并自動處理
如何自動識別和處理,需要搞清楚內容包含的信息載體元素和發布內容的行為模式。
信息載體上,內容可分為文字、圖片、音頻、視頻,其中對文字的處理手段最成熟,即關鍵詞、url等特殊文本信息過濾,圖片、音頻、視頻,惡意url鏈接地址識別。這個過程時間極短,系統只能通過詞庫或者二維模型做簡單運算并給出是否發布成功的提示,不能做過多運算。如bbs、cms都采用此過濾法處理。
傳播中如何識別和處理
行為模式上,對用戶所處地理位置(ip識別、地域識別)、訪問方式(登錄行為方式停留時間、是否立即發布后離開)、內容發布行為(發布頻率、提交速度如何)、賬號資料(昵稱、郵箱是否有無規律;是否間隔更換賬號登錄、賬戶之間是否同一批次注冊等)、社交關系(是否與馬甲賬號關聯、是否有真實社交關系存在、是否參與互動),通過這些維度建立模型進行用戶過濾(是否禁用賬號),內容過濾。這個過程需要系統強大的運算,故在發布后進行處理。比如搜搜問問違規問答發布后幾分鐘被清理,就是采用的此方法。
對機器無法識別處理的內容,比如一些文字內容中關鍵詞隱喻(正話反說、啞謎等手法)、拆分(如裝13)等處理手法,機器沒法識別,可采用用戶舉報功能。系統通過收集用戶反饋,對內容進行協同過濾。比如新浪微博大多數內容的有舉報功能。
但也有特殊情況,內容發布的時候不違法規則,但發布后造成了不良影響被判為違規內容了。這時候通常采用系統管理員立即進行人工清理。如新浪微博李開復事件禁言三天。
對違規內容處理手段
對違規內容,一般采用前臺清理后臺數據保留的做法,嚴肅的,數據全部清理。又或者采用僅發布者可見,其他用戶不可見。或者內容排序墊底靠后不靠前顯示,讓違規內容直接淹沒掉。
看完你會發現處理違規內容的過程,其實和推薦引擎的工作原理挺相似的。最開始一層過濾需要快速響應,類似推薦引擎的冷啟動,第二層、和第三層過濾,就需要采用離線數據模型和在線隱性行為模型(系統對用戶交互產生的數據反饋分析)和顯性行為模型(其他用戶舉報的反饋數據分析)結合分析過濾掉。
本文雖然寫的有點硬,但還是較好理解。主要分享的是一種思路,處理此類問題的方式。產品同學在具體工作實踐中,可以結合自己的產品找出維度建立過濾層級模型使用。
里面網站打不開了-云服務器問題此網站的安全證書有問題騰訊云cvm服務器鏡像備份數據域名后綴影響收錄嗎?什么域名可以好收錄?上海網站建設應考慮用戶的需求以及審美意識申請更換宿主機-其他問題域名的空間與構成站群推廣設置問題-其他問題