奇摩目前採用的是 關鍵字過濾
工程師會設定一些關鍵字
一遇到此關鍵字 系統直接移除並扣點
這不是人工檢查然後扣點
所以你一貼完 不用一秒 東西就不見了
不是人工檢舉的
早期很多有名的直銷
例如 ㄏㄜˋ ㄅㄠˇ ㄈㄨˊ 直銷
(很抱歉我用注音 因為不能打出來)
只要你打到 那三個字(國字) 系統就會直接刪除
那是自動的 不是人工的
不需要被人檢舉 直接就會刪除了
這個原理很簡單 就是[關鍵字過濾]而已
特定的字串、特定的網址
系統馬上就直接刪除
但問題來了
有些人是無辜的發言人
例如有人 發問
[知識] 有一個字稱 賀#芙的人跑來跟推銷 那是啥?
好,當那個人發問了一個問題
如果他那三個字沒有做屏蔽(我上面用#字做了屏蔽)
他如果是直接打出來
那麼系統馬上認定那是打廣告的 就馬上刪除了
所以會有一些無辜者的出現
這是因為大量使用系統程式 的關鍵字過濾
而不是用人工機制
因為 用人工的很費時 而且知識+ 每天湧入幾萬則發問
每天有幾萬則的回答
很難逐個逐個去用人工檢查 所以大量依賴 關鍵字過濾
那麼 貼圖片怎麼辦?
有些人發問之後
有回答者除了文字上的敘述之外
還會輔以圖片來解說
這時候 圖片就必須依賴網址來呈現
例如
http://cdn0.qoooo.com/img/3/25380-2.jpg
像這樣 來呈現一張圖片
但問題來了
假設你的圖片是
http://www.abcd1234.com.tw/web/131.jpg
而被系統自動刪除
未必是你這張圖片不合法
而是 系統的關鍵字 是過慮
所有來自 abcd1234.com.tw 的網址
舉凡網址內出現 abcd1234.com.tw 一律列為黑名單 自動刪除並扣點
這有個壞處 會刪除到一些無辜者
舉例
http://www.abcd1234.com.tw/web/sex1123.gif
假設這是一個打廣告的
那麼 工程師在設定時 不會針對這張圖片做黑名單
而是針對 abcd1234.com.tw 這個一小串網址做過濾
所以 當日後有人貼了其他圖片 只要是掛載於 abcd1234.com.tw 的
一律自動刪除並扣點
即便與上述 並非同一張
舉例 一個電路板解說的知識圖片
http://www.abcd1234.com.tw/web/3312.jpg
好,各位看網址尾端,
違規的廣告圖片是sex1123.gif
電路板解說的知識圖片是 3312.jpg
顯然這兩張並非同一張
但是系統無法針對個別圖片做過濾
而是只要遇到 abcd1234.com.tw 這個字串 就馬上自動刪除並扣點
所以這樣會產生一些無辜者
這樣解說 您看懂了嗎
有些網址 是被列入黑名單
但是那些網址的尾巴 可能掛載許許多多的圖片或者是資訊
而那些資訊和圖片未必都是違規的
有些網址本身 是廣告的商業的
所以針對該網址的主幹 做 關鍵字過濾
至於後面尾端的一些圖片或資訊
則是一併過濾 無法針對個別做篩選