大福餅

大福餅

2024-01-01から1年間の記事一覧

【論文紹介】JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

arxiv.org ・学会発表用として投稿された日本語版のproceeding https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/C3-5.pdf 概要 所感 余談 概要 テキストと図表を含む日本語版のドキュメントのVQAデータセットを作成し、それらを用いて近年の主…

人工言語による事前学習を用いた言語間転移可能な知識の分析

www.jstage.jst.go.jp 昨日、ベッドの上で寝ながら読んでいたが面白かった。 概要 所感 概要 人工言語を用いた事前学習をTransformerのエンコーダに学習させ、そのエンコーダを自然言語の言語モデリングに転移したときの性能を測定させた論文。 先行研究の結…

アルツハイマー病研究、失敗の構造

アルツハイマー病研究、失敗の構造 作者:カール・ヘラップ みすず書房 Amazon 読み終えたので所感を。 所感 所感 アルツハイマー病の特効薬がなぜ出来ないのか、というテーマを基に、アルツハイマー病の歴史、それらにまつわる主題な研究、定義も含めたこれ…

E資格 2024 #1 受験レポ

www.jdla.org 受験し合格したのでレポート。 (追記:Qiitaにも初投稿、このブログ記事の内容を少し修正した) qiita.com 背景 勉強について 受験について 受験申込みについて 受験会場について 受験について 所感 背景 受験理由:会社の業務の都合上、必要と…

GCPのメモ 2/n

GCP

概要 概要 Cloud Audit Logs: リソースの作成・データの読み取りなどの操作がログとして記録 不正アクセス・データ漏えいなどの有無 プロジェクト、フォルダ、組織ごとに保管される 種類: 管理アクティビティ監査ログ:リソース構成やメタデータの更新に関…

GCPのメモ Compute Engine 1/n

GCP

概要 概要 Compute Engine: 仮想増しをコンピューティングリソースとして提供するプロダクト。個々の仮想マシンはインスタンスと表される。 料金体系は、インスタンスの起動時間やインスタンスに設定したvCPU・メモリなどに応じて課金される従量課金となって…

Langchain を触ってみる

www.udemy.com LangChain を触っている。学習途中ではあるが、簡単にメモ。 概要 所感 概要 講義元では「gpt-3.5-turbo」を使っているが、それ以外のモデルでも使うことは可能 但し記述を少し変えなくてはならない 例えばhuggingfaceのモデルではhuggingface…

gemma を使ってみた

cloud.google.com Geminiと同様の方法で作られた軽量モデル「Gemma」を使ったという話。 所感 IgakuQA と呼ばれる医師国家試験用のデータセットを使って、Gemmaに解かせてみた 使ったモデルはgemma-7b-it 参考したページは以下の通り 特定のモデルでデータセ…

最強DB講義 大規模言語モデルの基礎・最新動向

dblectures.connpass.com だいぶ前に参加したオンライン講義である。 本当は聞いた当日にでも書こうと思ったのだが、この講義を聞いている途中に体調を崩し、今日ようやくアーカイブを見て最後まで確認することが出来た。 一応、参加者だけにリンクを知らさ…

R-CNN, Fast R-CNN, Faster R-CNN の流れ

概要 余談 概要 物体検出モデルは、画像内に写っている物体の分類及び位置を行う R-CNN: Selective Searchにより物体の位置の候補領域を求める。その後、各領域をCNNに入力して、特徴マップを取得し特徴マップと教師を用いて、SVMにより分類し、領域 (バウン…

VertexAI Search and Conversation の Search と Conversationの違いとは

GCP

cloud.google.com 概要 余談 概要 GCPの生成AI向けのサービスである、Search and Conversation。よく纏めて紹介されているのを見るが、SearchとConversationの違いは何なのか気になり調べ Searchは「入力テキストに対して、ストレージの非構造化データ、BigQ…

C++ の vector から要素を完全に取り除く方法

leetcode.com この頃コードを書く習慣が無くなってきているので、思い出しついでにLeetCodeの簡単な問題から解いて、感覚を取り戻している。 今日は、冒頭のリンク先の問題である「すでに数値が入っている配列から、指定した数値を取り除いた配列にする」問…

【3章以降】世界一エンジニアの思考法

sumidare.hatenablog.com 前回の記事の続き. 残りの箇所を読み終えたので,概要と所感を記述する. 概要 感想 概要 マルチタスクは生産性が最低なのでやらない 「今手を付けている仕事を1つに限定する」 一日4時間は自分だけの時間を確保する teams,メール…

【1章から3章の途中まで】世界一エンジニアの思考法

所感 世界一流エンジニアの思考法 (文春e-book) 作者:牛尾 剛 文藝春秋 Amazon 所感 amazonにてセールが行われていたので、何かと話題になっている本を購入した。 現状まだ途中までしか読めていないが、為になる話が幾つかあったのでまとめてみる。 どんなに…

【道具紹介】デスク付きのエアロバイク

www.alinco.co.jp デスク付きのエアロバイクを購入し、今日届いた 漕ぎながら、作業が出来るという優れもの 少し使ってみた感想としては以下の通り 音が静かなので、家の中で何時でも漕げる デスクが大きくノートPCぐらいなら余裕で置ける またタブレットな…

【用語】再帰型ニューラルネットワークに関する用語

E資格の勉強にしており、それらの用語のまとめる (記事の水増しという) エコーステートネットワーク:入力の重みと隠れ層の重みをランダムな値で固定し、出力の重みのみを学習する。シンプルな線形回帰の問題になり、購買消失や勾配爆発が発生しなくなり、…

【論文紹介】AIJack: Security and Privacy Risk Simulator for Machine Learning

arxiv.org 概要 所感 概要 機械学習モデルの学習・運用におけるセキュリティ・プライバシーリスクをシミュレーションしてくれるオープンソースのライブラリ その名をAIJack github.com 例えばMLモデルの入力データに目立たないノイズを乗せて誤認識させるEva…

【論文紹介】Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4: 精度向上のための26のプロンプトの原則

arxiv.org github.com 明けましておめでとうございます。 概要 LLMの回答精度を向上させるための「26のプロンプト原則」を紹介する論文 Table1 引用 以下の5つのカテゴリに分けて、26の原則について説明している。 プロンプトの構造と明瞭さ 2. プロン…