GithubHelp home page GithubHelp logo

danny0838 / content-farm-terminator Goto Github PK

View Code? Open in Web Editor NEW
1.3K 14.0 47.0 84 MB

Content Farm Terminator browser extension/「終結內容農場」瀏覽器套件

Home Page: https://danny0838.github.io/content-farm-terminator/

License: GNU General Public License v3.0

Batchfile 0.44% Shell 0.36% JavaScript 91.34% CSS 3.40% HTML 4.46%
chrome-extension firefox-addon

content-farm-terminator's People

Contributors

danny0838 avatar deepchirp avatar flandredaisuki avatar wenketel avatar yfdyh000 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

content-farm-terminator's Issues

错误标识了维基页面

在Android的Firefox上安装了这个扩展,使用Google搜索出现标识了维基百科的情况,但是点进去又不会弹出警告页面,也就是实际没有拦截。
示例页面:
unnamed

地址:Google(手机访问)

用 async/await 重構

看了一下作者有意重構並簡化程式碼(2.2.4)
有考慮用 async / await 來取代 Promise 嘛?
雖然如果要 catch 要用 try-catch 有點醜

我不確定 Chrome / 手機版會不會炸掉,但 Fx 57+ 桌面版應該是不太會炸掉才對

地址栏图标

最近版本, 地址栏出现了图标, 感觉完全没有必要哇
1

我可以修改您的插件吗

尊敬的作者您好,很高兴您开发了这个插件。
我很喜欢这个插件,我想要插件弹出的网页是弹出一个界面提示功能。因为我在浏览facebook的时候,不喜欢一些专页或社群,但是终结农场插件会弹出一个很大的界面来拦阻,我继续浏览就是插件处理过的页面。很希望能有个开关,只保留检测网页,标注黑名单里的网页功能。

不知道我是否能修改您的插件,仅限于自己使用。不会发布到网络。我其实不懂这些语言,只是喜欢。

Safari support

Please release the App Store if you can, as a paid app is also very good.

YouTube clone

https://kzclip.com
以上網站疑似為 YouTube clone ,例如:
原影片:https://www.youtube.com/watch?v=QJgRN_ZP9yk
該網站:https://kzclip.com/video/QJgRN_ZP9yk/die-neusten-und-coolsten-s%C3%BC%C3%9Figkeiten-frittieren-mit-joey-s-jungle-%F0%9F%98%8D%F0%9F%8D%AD.html

這類網站應該符合條件「無篩選編輯的大量轉載」。


註:運行 Invidious 的網站不算是 YouTube clone ,因為 Invidious 沒有廣告或 trackers ,開放源碼,是 YouTube 的替代 front-end 。

想詢問一下新增自動隱藏的功能

假設偵測到內容農場
能不能直接令連結的css : display:none
然後這個功能可以切換讓使用者自行選擇要不要用這樣
畢竟打從一開始就看不到的話
就不會有好奇心的問題了

兩個ptt偽站

sexptt.tk
orzptt.tk

都是168ptt的域名
介面跟官方PTT的網頁版一模一樣
但是會在最後的推文加上廣告,做假推文。

推 99bio: 真心推薦! 廣告 廣告 廣告

請求加入內建清單!(168ptt本站已經在清單裡面了)

話說網頁的舉報表單只能提交一次?

方便的block xuite裡的內容農場

在google上找資料,尤其是找某些產品的開箱文,台灣通常會有兩個網站來源。
pixnet和xuite
pixnet比較簡單,就整個block,
u5sylviaiefm.pixnet.net
但xuite就比較麻煩,要像你整理的黑名單的方式blcok
/^https?://(?:m[.])?blog[.]xuite[.]net/n8h6f80xr3(?=[/?#]|$)/
是否考慮在右鍵增加一個直接parser url後面的使用者ID,不然每次想block都要copy然後再貼上,有點麻煩…
也就是直接跳出/^https?://(?:m[.])?blog[.]xuite[.]net/n8h6f80xr3(?=[/?#]|$)/ 讓使用者去點選。

能不能把封锁内容增加开关功能?

浏览一些自定义网址,但是提示是内容农场后,继续进去就是被处理过的页面。建议在设置面板增加虽然是内容农场,但是也可以进去,就是这个功能可以开关。
另外,能不能增加网络白名单功能,用绿色图标标识,这样就把自己常进入的网址作一个标识,这样方便错误进入一些不合适的网址。

QAStack 疑似 StackOverFlow 的机翻搬运站

2020-08-18 15-31-26 的屏幕截图

这个站的站长似乎相当会搞,整了包括但不限于以下多(机翻)语言站点:

  • qastack.cn
  • qastack.jp
  • qastack.com.br
  • ...

建议直接加入 qastack.* 豪华套餐。感谢!:)

YouTube clone

我發現更多 YouTube copiers 的網域:

  • ruclip.com
  • ru-clip.net
    • https://skubny.ru-clip.net/xizvCi0UAzM/edifier-s1000mkii-vs-edifier-r1700bts-sound-frequency-response-comparison.html
    • https://www.youtube.com/watch?v=xizvCi0UAzM

列出中了哪個黑名單

列出中了哪個黑名單 還有具體是中了黑名單的那一條規則

例如

黑名單: 網路黑名單 (https://github.com/sioxe823/Project-RnJlRUhL/raw/main/exaggerated_news.txt)
規則: people.com.cn

image

瀏覽器剛啟動會執行頁面中的連結

似乎是本套件和 uBlock Origin 衝突,單獨開啟不會發生的樣子

Reproduce:

  1. 打開瀏覽器「恢復先前的瀏覽狀態」跟關閉「關閉瀏覽器後清除歷史紀錄」的選項
  2. 擴充套件只安裝本套件及 uBlock Origin
  3. 保留任意頁面(例如此頁)後關閉瀏覽器
  4. 再度開啟瀏覽器時,會自動連結到原瀏覽頁面中的任一連結,按上一頁可跳回

Environment:

OS Browser Extensions
Linux Mint 18.3 Firefox 62.0b18 (64bit) 本套件 v3.3.2; uBO v1.16.16
Windows10 Firefox 61.0.2 tete009 本套件 v3.3.2; uBO v1.16.16
Windows10 Chrome 68.0.3440.75 本套件 v3.3.1; uBO v1.16.16

舉報 pixnet 上的內容農場

pixnet 上實在有太多內容農場,尚未列入黑名單的例子如下:

userid (.pixnet.net) 理由
prisci61 [1]
mcdonald11 [1]
elizabeth75 [1]
uwi1014508 [1]
consta28 [1]
r75fp79l [1] [2]
t59xq59v [1] [2]
g11oz48c [1] [2]
j99jl13t [1] [2]
r72ov24q [1] [2]
z31lj15b [1] [2]
f57bf55j [1] [2]
理由列表
  1. 無篩選編輯的大量轉載(大量轉載 Yahoo奇摩知識+ 的內容)
  2. 顯示相同且佔據極大篇幅的廣告 (https://pic.pimg.tw/toye4441/1468746283-333116064.png)

只要在 DuckDuckGo 以 "系" "大學" "排名" site:pixnet.net 搜尋,即可找到一堆漏網之魚。
以隨機字串作為 userid 的 pixnet 網域,十之八九都是內容農場。

请问这些表达式能放到Google试算表或excel里用吗?

我想在试算表里批量转换我要加入黑名单的网址。请问这些表达式能放到Google试算表或excel里用吗?如何使用呢? 我用函数 REGEXEXTRACT,不能直接使用。
另外,能不能增加识别网址服务器在**,则自动屏蔽的功能,例如插件获取who.ip的数据来识别页面网址,则根据**ip段提示。

/^https?://(?:(?:[\w-]+.)?facebook.com(?:/|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)groups/(\d+)(?=[/?#]|$)/ /^https?://(?:(?:[\w-]+.)?facebook.com(?:/|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)groups/$1(?=[/?#]|$)/
/^https?://(?:(?:[\w-]+.)?facebook.com(?:/(?:pg/)?|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)(?:[^?#]+/)?(?:[^/?#]+-)?(\d+)(?=[/?#]|$)/ /^https?://(?:(?:[\w-]+.)?facebook.com(?:/(?:pg/)?|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)(?:[^?#]+/)?(?:[^/?#]+-)?$1(?=[/?#]|$)/
/^https?://(?:(?:[\w-]+.)?facebook.com(?:/(?:pg/)?|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)(?!\w+.php(?:?|$))([\w.-]+)(?=[/?#]|$)/ /^https?://(?:(?:[\w-]+.)?facebook.com(?:/(?:pg/)?|\b[^#]+#!/)|(?:fb|m).(?:com|me)/)$1(?=[/?#]|$)/
/^https?://(?:\w+.)?twitter.com/([\w-]+)(?=[/?#]|$)/ /^https?://(?:\w+.)?twitter.com/$1(?=[/?#]|$)/

舉報疑似內容農場

本人檢視舉報記錄後,發現當中有部分記錄可能因為回報者未有提供足夠資訊而被忽略,未被列入黑名單。

  • exceptionshub.com
    • 例子:https://exceptionshub.com/javascript-best-practices-of-timeout-after-ajax-call.html,似乎抄襲 stackoverflow 的這條問題,但該網頁未有指出原文來自 stackoverflow 。
  • pinkupost.com
    • 例子:http://pinkupost.com/%E6%A3%AE%E4%B8%83%E8%8F%9C-x-%E4%B8%AD%E6%9D%91%E5%80%AB%E4%B9%9F%E7%B5%84cp%EF%BC%81%E5%85%B1%E6%BC%94%E3%80%8C%E9%80%99%E4%BB%BD%E6%84%9B%E8%A6%81%E5%8A%A0%E7%86%B1%E5%97%8E%EF%BC%9F%E3%80%8D/,疑似未經授權翻譯モデルプレス的文章
      • https://mdpr.jp/attention 可見,モデルプレス的文章禁止擅自引用、複製、轉載。若 pinkupost.com 果真有獲得授權,應會註明「本文章獲 XXX 公司 / XXX 網站 授權轉載」,而非只說明資料來源為モデルプレス。
        • 該網站的其他文章也似乎是未經授權的翻譯,並說明 "Photos credit to all respective photographer and owner" 。
          例子:http://pinkupost.com/%e7%b9%bc%e3%80%8e%e7%8a%ac%e9%b3%b4%e6%9d%91%e3%80%8f%e4%b9%8b%e5%be%8c%ef%bc%8c%e3%80%8c%e6%81%90%e6%80%96%e4%b9%8b%e6%9d%91%e3%80%8d%e7%b3%bb%e5%88%97%e7%ac%ac2%e5%bd%88%e7%a2%ba%e5%ae%9a%e8%a3%bd/
          若獲授權轉載,理應準確、清楚說明相關圖片、文字的著作權擁有者才是。

[Feature Request] 單行註解

目前語法可以對特定規則註解:

rule comment

但希望可以增加單行註解來註解整個規則集,而不用切分檔案:

# 新聞黑名單
rule_1
rule_2
regex_1 comment

# 論壇黑名單
rule_3

感覺可以直接 match 第一個字是 # 就好,雖然 URI 裡 # 是合法字元 (hash),但在連結或頁面的封鎖上去針對 hash 封鎖應該是不合理的,不會造成歧義

能提供去除右鍵選單的方式嗎?

 "blockTab": {
    "message": "將此分頁的網域加入黑名單",
    "description": "Context menu blocker on tab"
  },

  "blockPage": {
    "message": "將此頁面的網域加入黑名單",
    "description": "Context menu blocker on page"
  },

  "blockLink": {
    "message": "將此連結的網域加入黑名單",
    "description": "Context menu blocker on link"
  },

  "blockSelection": {
    "message": "將選取文字網域加入黑名單",
    "description": "Context menu blocker on selection"
  },

  "blockDomain": {
    "message": "將此網域加入黑名單:",
    "description": "Prompt for blocking domain"
  },

這幾個功能 我常常誤觸OTZ
會提供去除這些選項的方式嗎?

放行網站

若規則為:

*cntv*

但誤殺了 想放行網站 我有個想法:

當前網站: fuckcntv.aprilfoolsday.test.appledaily.co.hk
放行範圍: (可以滑動 左至右) fuckcntv.aprilfoolsday.test.appledaily.co.hk / aprilfoolsday.test.appledaily.co.hk / test.appledaily.co.hk / appledaily.co.hk / co.hk(這個也做吧 就怕萬一有人有這個需要?)

自定義網站類型

你即將訪問「內容農場」 --> 「紅色媒體」

 # type:紅色媒體
或
 # type=紅色媒體

你即將訪問紅色媒體 要繼續嗎?👍👍👍
你即將訪問類內容農場網站 要繼續嗎?👍👍👍
你即將訪問色情網站 要繼續嗎?👍👍👍

怎樣判斷範圍(行x~行y)?.. 這個就要交給經驗豐富的您了

 # type:紅色媒體
 # type:紅色媒體 end

這樣?.... 還是交給你吧~

[help wanted] Android 端 iceraven(firefox) 新版没有回应

在 Android 端启用这个扩展后开启任何网页,都会造成浏览器所有网页没有回应,等待几分钟后正常。
停用这个扩展后不会出现这种现象

iceraven 1.2.1 base fenix 81
iceraven 1.3.0 base fenix 81.1.4
android 10

擴充中國的內容農場黑名單

如題,在經過無數眾人的努力之下,內容農場黑名單成長了一倍,不過仍是以台灣的為主,海外就少得多。

中國的著作權觀念不太盛行,盜文為主的內容農場想必不少,但個人對中國網路環境及法律都不熟。要擴充農場名單,可能得麻煩各位來自中國的朋友幫忙了──你是否知道曾有中國網友整理過內容農場名單?或是自己有認識比較有名的農場?還望不吝提供。

當然如有香港或世界各地的華人朋友,也歡迎提供你們知道的農場。(香港的火星文比中國的民智更難明白啊orz)

你可以在此 issue 下發表,或是按標準流程填寫表單

建議建立去中心化地回報列表及標識

  • 有沒有一個類似這個又能讓群眾共識決擋下農場網站的服務呢,這個用 G form 中心化管理,我覺得這樣管理員太辛苦
  • 若只是標示農場,那麼以顏色濃度來表示回報是農場的人數,來提示農場可能性等級,或許就沒有這麼「絕對」
  • 目前的標示方式,只有是非,新生出來的 domain 無法馬上反應顯得較沒效率
    image

BuzzFeed 是新闻聚合网站。

www.buzzfeed.com
BuzzFeed 是正常的新闻聚合网站,而且他们有自己的独家新闻,不是故意为之的内容农场。对它的abuse主要是因为它是个靠研究病毒式传播发家极品新兴媒体。然后,病毒式传播于内容农场大有区别:既不靠假消息,也不会小题大做、标题党,靠的是发掘内容本身的价值。不能将它移除的话,至少应当移至 类内容农场 这个清单。
也确信它不会故意发假新闻。

https://www.helium.com/
https://help.aol.com/articles/aim-discontinued
也都 没有 解封……时间有几个月了,如无发现这些网站的内容农场

最后,既然

國外的網站當時比較多是從收集內容農場的發文中稍加篩選弄出來的

我很想看看是哪个国外网站这么酸,挂了这么多大网站……估计是把大量正常转发其他网站新闻的行为当做内容农场了,这是一个同 “把 MajorGeeks 当做默许流氓软件的网站” 一样愚蠢的错误。可惜找不到文章链接……唉,他们不怪流氓软件开发者,却怪软件网站。

推荐给假新闻网站和假冒网站单独定制警告内容
http://www.spam404.com/ 主要收录假冒网站

痞客幫相關的垃圾關鍵字廣告業配(SEO)有辦法封鎖嗎?

作者大大你好,最近我在Google搜尋一些3C產品時常會跳出部落格形式的廣告業配網站

有辦法隱藏這些網站嗎?(類似Google的Personal Blocklist)

可以搜尋看看這個關鍵字

tcell 冠元- tt650 240gb SSD

常見網頁標題跟內容

標題:【產品】XXXX【購物網站】-介紹
【產品】XXX【購物網站】-送禮
「這次和姊妹們發現這個購物網裡面的商品優惠或折扣就滿多的 而且滿常辦活動送更多優惠,」

標題:【評價】XXX
「經過多方比較後,發現 XXXX 居然曾造成搶購熱潮, 價格也很實在,重點是買的安心,到貨的速度還滿快的」

標題:商品XXX開箱
「最近常去逛的店歇業了,之後就好少到那邊晃啦,可是朋友一直問我 XXXX 那裡買比較便宜!」

標題:大心推薦-XXX【購物網站】
「同事昨天介紹這個給我 XXX ,說他已經有買了,也很滿意,所以推薦給我之後我就上網查了 XXX 的資料發現網友跟鄉民都非常的推薦」

標題:特賣 XXX 搶先看
「最近因為我自己想買直殺成本 XXX,相信許多人對他都有很深刻的印象!上購物網看相關推薦、開箱文、價格,評價、報價、規格」

標題:特賣會 XXX
「電腦週邊新品特賣會XXX,性能卓越、CP值超高!因為每年這時候買電腦週邊產品最便宜~折扣數也好!」

標題:熱銷商品 XXX
「所以我跟寶貝馬上googe一下,找看看有沒有 XXX 推薦評比或價格比較」

標題:送禮推薦 XXX 便宜
「 最近媽媽生日快到了,偷偷打聽後知道媽媽最近想買XXX」

標題:省錢 XXX 買便宜
「最近工作閒暇之餘去百貨工司看到 XXX 覺得還挺有興趣的. 印象中在網路上 XXX 的評價一直都挺高的」

小小想法

假設規則如下:

*cctv*

但如果我只想封鎖域名包括cctv 而不是整個網址包括cctv?? 謝

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.