GithubHelp home page GithubHelp logo

carrier-owl's Introduction

carrier-owl's People

Contributors

dependabot[bot] avatar fkubota avatar hpprc avatar narugit avatar wakame1367 avatar yas-rj avatar yoshiintokyo avatar yujidn avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar

carrier-owl's Issues

Workflow が Run owl で失敗する

Workflow がしばしば失敗します。
エラーメッセージと、メッセージから推測できる直接的な原因を以下に記載します。

■エラーメッセージ

Run poetry run python src/carrier-owl.py
  poetry run python src/carrier-owl.py
  shell: /bin/bash -e {0}
  env:
    pythonLocation: /opt/hostedtoolcache/Python/3.8.6/x64
    LD_LIBRARY_PATH: /opt/hostedtoolcache/Python/3.8.6/x64/lib
    SLACK_ID: ***
Traceback (most recent call last):
  File "src/carrier-owl.py", line 188, in <module>
    main()
  File "src/carrier-owl.py", line 183, in main
    results = serch_keywords(id_list, config['keywords'])
  File "src/carrier-owl.py", line 64, in serch_keywords
    title = bs.find('meta', attrs={'property': 'og:title'})['content']
TypeError: 'NoneType' object is not subscriptable

Error: Process completed with exit code 1.

■直接的な原因
src/carrier-owl.py の serch_keywords()関数にて、
bs.find('meta', attrs={'property': 'og:title'}) の戻り値がNoneになっている

ChromedriverがChromeのversionに合わなくてGithub Actionがエラーで止まります

Carrier-Owlをクローンして利用させてもらっているものです。素敵なシステム作成ありがとうございます。

急にGithub Actionがエラーでワークしなくなったので確認したところ以下の画像のエラーが出ていました。
(私の環境だけでしたらすいません)

解決案として

  • chromedriver追従してアップデートする
  • (可能であれば)Github Actionで利用可能なGoogleのバージョンを固定する

の2つが考えられます。前者だと毎回アップデートのたびに追従するのが負担かなという懸念があります。
私の方でもchromedriverをアップデートしてPRしようとしましたがインストール時にコケてしまうのでまず報告だけさせてもらいました。

chromedriver-binary v87 -> v89
https://pypi.org/project/chromedriver-binary/89.0.4389.23.0/

image

LINE通知対応

amagaeruさんのPR

SecretsにLINE_IDとして登録する。
Secretsが複数用意されていればそれら全てに通知がいくような仕様にする。

タイトルに改行が含まれる場合がある

for article in articles:
url = article['arxiv_url']
title = article['title']
abstract = article['summary']
score, hit_keywords = calc_score(abstract, keywords)
if (score != 0) and (score >= score_threshold):
title_trans = get_translated_text('ja', 'en', title, driver)
abstract = abstract.replace('\n', '')
abstract_trans = get_translated_text('ja', 'en', abstract, driver)

でtitleも改行のreplaceを行なったほうがいいかもしれない、という提案になります。
60行目に以下を挿入するだけになります。

            title = title.replace('\n', '')

例えば以下の論文では改行置換ありなしでdeeplの結果が変わっていました。

url: http://arxiv.org/abs/2205.00779v1

改行置換なし

title:    ゼブラ ゼロブロックによるCNNアクセラレータのメモリ帯域幅の削減
   活性化マップの正則化
title_en:    Zebra: Memory Bandwidth Reduction for CNN Accelerators With Zero Block
 Regularization of Activation Maps

改行置換あり

title:    ゼブラ 活性化マップのゼロブロック正則化を用いたCNNアクセラレータのメモリ帯域幅の削減
title_en:    Zebra: Memory Bandwidth Reduction for CNN Accelerators With Zero Block  Regularization of Activation Maps

論文のタイトルには改行が含まれておらず、arxiv.queryの結果には含まれているのでarxiv.queryのところで何とかして欲しい気持ちですが、↓を見る限りは使う側で対処した方が良さそうかなという感じです。

lukasschwab/arxiv.py#48

アブストラクトの改行の有無について

出力されるアブストラクトに改行を入れていると思いますが、何か意図があるのでしょうか(slackだと見づらいなど)。
私は改行を取り除いてlineに通知していますが、他の方の意見も聞きたいと思いissueを立てました。

配信日固定案

(2日前の論文を送る場合)

月火水木金に送信するように設定を行うと、土日にarxivが更新されない以上、水木金にしか配信されない。
これを解消したい。

現在の案

  • 月火水木金にその前の木金月火水に出た論文を配信する仕様にする。
  • デメリットとしてはこの仕様だと、土日に論文が配信してほしい人に対応できない。

Comments をメッセージに含めるオプションをつけたい

赤枠の Comments の部分(通常既に会議に出ているかどうかが書かれている)は読むときの判断材料になりやすく、個人的にはチェックする部分なので、例えば include_comments みたいな bool 値を設定して、True のときは一緒に流せるようにできると嬉しいです。(やる気が出てきたら自分でPR出そうと思います)

スクリーンショット 2021-06-04 19 57 54

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.