【論文紹介】JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

論文

arxiv.org ・学会発表用として投稿された日本語版のproceeding https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/C3-5.pdf 概要所感余談概要テキストと図表を含む日本語版のドキュメントのVQAデータセットを作成し、それらを用いて近年の主…

2024-03-30

人工言語による事前学習を用いた言語間転移可能な知識の分析

論文

www.jstage.jst.go.jp 昨日、ベッドの上で寝ながら読んでいたが面白かった。概要所感概要人工言語を用いた事前学習をTransformerのエンコーダに学習させ、そのエンコーダを自然言語の言語モデリングに転移したときの性能を測定させた論文。先行研究の結…

2024-01-06

【論文紹介】AIJack: Security and Privacy Risk Simulator for Machine Learning

論文

arxiv.org 概要所感概要機械学習モデルの学習・運用におけるセキュリティ・プライバシーリスクをシミュレーションしてくれるオープンソースのライブラリその名をAIJack github.com 例えばMLモデルの入力データに目立たないノイズを乗せて誤認識させるEva…

2024-01-03

【論文紹介】Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4:　精度向上のための２６のプロンプトの原則

論文

arxiv.org github.com 明けましておめでとうございます。概要 LLMの回答精度を向上させるための「２６のプロンプト原則」を紹介する論文 Table1 引用以下の５つのカテゴリに分けて、２６の原則について説明している。プロンプトの構造と明瞭さ 2. プロン…

2023-12-28

【論文紹介】Gemini: A Family of Highly Capanble Mutimodal Models

論文

概要所感 arxiv.org ざっと目を通したので概要と所感を記す．概要 Googleが出したマルチモーダルモデルの「Gemini」に関する論文マルチモーダルモデル，というのはテキスト，画像，音声，動画というように異なる形式データを同時に扱って出力するモデル．…

2023-12-21

【論文紹介】Deep Learning 、そしてGemini のpaperが出た

論文時事

www.nature.com 概要感想その他概要 2015年のDeep Learning のレビュー論文教師学習、逆誤差伝播法、CNN、RNNといった深層学習の基礎中の基礎を述べているレビュー論文大事だと思った内容機械学習：カーネルメソッドのような非線形特徴を用いると、ト…

2023-12-17

【論文紹介】Attention is All You Need

論文

概要感想 arxiv.org 概要 Google が2017年ごろに出したTransformer の論文 RNN、encoder-decoderモデルにAttentionと呼ばれる機構を追加したことによって、計算量を減らしながら精度を保つことに成功した Attentionというのは「注意機構」と呼ばれ、入力の…

大福餅

大福餅

論文