大福餅

大福餅

【論文紹介】JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

arxiv.org ・学会発表用として投稿された日本語版のproceeding https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/C3-5.pdf 概要 所感 余談 概要 テキストと図表を含む日本語版のドキュメントのVQAデータセットを作成し、それらを用いて近年の主…

人工言語による事前学習を用いた言語間転移可能な知識の分析

www.jstage.jst.go.jp 昨日、ベッドの上で寝ながら読んでいたが面白かった。 概要 所感 概要 人工言語を用いた事前学習をTransformerのエンコーダに学習させ、そのエンコーダを自然言語の言語モデリングに転移したときの性能を測定させた論文。 先行研究の結…

アルツハイマー病研究、失敗の構造

アルツハイマー病研究、失敗の構造 作者:カール・ヘラップ みすず書房 Amazon 読み終えたので所感を。 所感 所感 アルツハイマー病の特効薬がなぜ出来ないのか、というテーマを基に、アルツハイマー病の歴史、それらにまつわる主題な研究、定義も含めたこれ…

E資格 2024 #1 受験レポ

www.jdla.org 受験し合格したのでレポート。 (追記:Qiitaにも初投稿、このブログ記事の内容を少し修正した) qiita.com 背景 勉強について 受験について 受験申込みについて 受験会場について 受験について 所感 背景 受験理由:会社の業務の都合上、必要と…

GCPのメモ 2/n

GCP

概要 概要 Cloud Audit Logs: リソースの作成・データの読み取りなどの操作がログとして記録 不正アクセス・データ漏えいなどの有無 プロジェクト、フォルダ、組織ごとに保管される 種類: 管理アクティビティ監査ログ:リソース構成やメタデータの更新に関…

GCPのメモ Compute Engine 1/n

GCP

概要 概要 Compute Engine: 仮想増しをコンピューティングリソースとして提供するプロダクト。個々の仮想マシンはインスタンスと表される。 料金体系は、インスタンスの起動時間やインスタンスに設定したvCPU・メモリなどに応じて課金される従量課金となって…

Langchain を触ってみる

www.udemy.com LangChain を触っている。学習途中ではあるが、簡単にメモ。 概要 所感 概要 講義元では「gpt-3.5-turbo」を使っているが、それ以外のモデルでも使うことは可能 但し記述を少し変えなくてはならない 例えばhuggingfaceのモデルではhuggingface…

gemma を使ってみた

cloud.google.com Geminiと同様の方法で作られた軽量モデル「Gemma」を使ったという話。 所感 IgakuQA と呼ばれる医師国家試験用のデータセットを使って、Gemmaに解かせてみた 使ったモデルはgemma-7b-it 参考したページは以下の通り 特定のモデルでデータセ…

最強DB講義 大規模言語モデルの基礎・最新動向

dblectures.connpass.com だいぶ前に参加したオンライン講義である。 本当は聞いた当日にでも書こうと思ったのだが、この講義を聞いている途中に体調を崩し、今日ようやくアーカイブを見て最後まで確認することが出来た。 一応、参加者だけにリンクを知らさ…

R-CNN, Fast R-CNN, Faster R-CNN の流れ

概要 余談 概要 物体検出モデルは、画像内に写っている物体の分類及び位置を行う R-CNN: Selective Searchにより物体の位置の候補領域を求める。その後、各領域をCNNに入力して、特徴マップを取得し特徴マップと教師を用いて、SVMにより分類し、領域 (バウン…

VertexAI Search and Conversation の Search と Conversationの違いとは

GCP

cloud.google.com 概要 余談 概要 GCPの生成AI向けのサービスである、Search and Conversation。よく纏めて紹介されているのを見るが、SearchとConversationの違いは何なのか気になり調べ Searchは「入力テキストに対して、ストレージの非構造化データ、BigQ…

C++ の vector から要素を完全に取り除く方法

leetcode.com この頃コードを書く習慣が無くなってきているので、思い出しついでにLeetCodeの簡単な問題から解いて、感覚を取り戻している。 今日は、冒頭のリンク先の問題である「すでに数値が入っている配列から、指定した数値を取り除いた配列にする」問…

【3章以降】世界一エンジニアの思考法

sumidare.hatenablog.com 前回の記事の続き. 残りの箇所を読み終えたので,概要と所感を記述する. 概要 感想 概要 マルチタスクは生産性が最低なのでやらない 「今手を付けている仕事を1つに限定する」 一日4時間は自分だけの時間を確保する teams,メール…

【1章から3章の途中まで】世界一エンジニアの思考法

所感 世界一流エンジニアの思考法 (文春e-book) 作者:牛尾 剛 文藝春秋 Amazon 所感 amazonにてセールが行われていたので、何かと話題になっている本を購入した。 現状まだ途中までしか読めていないが、為になる話が幾つかあったのでまとめてみる。 どんなに…

【道具紹介】デスク付きのエアロバイク

www.alinco.co.jp デスク付きのエアロバイクを購入し、今日届いた 漕ぎながら、作業が出来るという優れもの 少し使ってみた感想としては以下の通り 音が静かなので、家の中で何時でも漕げる デスクが大きくノートPCぐらいなら余裕で置ける またタブレットな…

【用語】再帰型ニューラルネットワークに関する用語

E資格の勉強にしており、それらの用語のまとめる (記事の水増しという) エコーステートネットワーク:入力の重みと隠れ層の重みをランダムな値で固定し、出力の重みのみを学習する。シンプルな線形回帰の問題になり、購買消失や勾配爆発が発生しなくなり、…

【論文紹介】AIJack: Security and Privacy Risk Simulator for Machine Learning

arxiv.org 概要 所感 概要 機械学習モデルの学習・運用におけるセキュリティ・プライバシーリスクをシミュレーションしてくれるオープンソースのライブラリ その名をAIJack github.com 例えばMLモデルの入力データに目立たないノイズを乗せて誤認識させるEva…

【論文紹介】Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4: 精度向上のための26のプロンプトの原則

arxiv.org github.com 明けましておめでとうございます。 概要 LLMの回答精度を向上させるための「26のプロンプト原則」を紹介する論文 Table1 引用 以下の5つのカテゴリに分けて、26の原則について説明している。 プロンプトの構造と明瞭さ 2. プロン…

終盤から始めたブログの意義と学習の成果

概要 概要 2023年の終盤から始めたこのブログの意義について,今更ながら書いてみる 実は単純に特筆すべきネタがない 無くはないが,わざわざ纏めるまでのところまで行ってない このブログを始めた理由は主に3つ 学んだ内容をアウトプットすること 見つけた…

【論文紹介】Gemini: A Family of Highly Capanble Mutimodal Models

概要 所感 arxiv.org ざっと目を通したので概要と所感を記す. 概要 Googleが出したマルチモーダルモデルの「Gemini」に関する論文 マルチモーダルモデル,というのはテキスト,画像,音声,動画というように異なる形式データを同時に扱って出力するモデル.…

プロンプトインジェクションによる事例

概要 感想 note.com 概要 プロンプトインジェクションによる被害について解説したnote 海外のディーラーのHPに設置したセールチャットボットに対してプロンプトインジェクションを仕掛けたという事例 カスタマイズの無料サービスや新車を1$で売ることを確約…

GCP リージョンとゾーン

概要 概要 GCPにおける「リージョン」と「ゾーン」についてまとめる リージョン:データセンターが置かれている地理的なエリアを指す単位。 ゾーン:リージョンの中に存在している、独立して稼働が可能なコンピューティングリソースのグループを示す単位。 …

DI (Dependency Injection) とは?

概要 参考 概要 DI (Dependency Injection) についてまとめた 依存性の注入とも呼ばれる 私の解釈には「あるプログラムが別のプログラムの関数を持ってくる」ことで、別々にプログラムを作ることで、全体として疎結合なプログラムにすることだと思っている N…

【論文紹介】Deep Learning 、そしてGemini のpaperが出た

www.nature.com 概要 感想 その他 概要 2015年のDeep Learning のレビュー論文 教師学習、逆誤差伝播法、CNN、RNNといった深層学習の基礎中の基礎を述べているレビュー論文 大事だと思った内容 機械学習:カーネルメソッドのような非線形特徴を用いると、ト…

Googleのプロンプト設計戦略

ai.google.dev 概要 感想 概要 Googleからプロンプト設計に関するドキュメントが出ていた プロンプトの例を出しながら、目的に対して適切な解答を得るための設計の工夫が書かれている 明確な指示を出す 例を含める 多くの例を出しすぎると過学習を起こす ア…

【技術書】リーダブルコード

概要 感想 リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice) 作者:Dustin Boswell,Trevor Foucher オライリージャパン Amazon 概要 リーダブルコードを読んだ 相当前に買っておいて、積読していた 仕事でコ…

Skills boost のGSP313が難しかった

GCP

概要 感想 partner.cloudskillsboost.google 概要 skills boostにあるGSP313「クラウドのリソースを作成、管理する:チャレンジラボ」のタスク3 HTTPロードバランサを設定するが難しかった ACEに関する学習で行っていた とにかく手順が分かりにくいのと、そ…

【論文紹介】Attention is All You Need

概要 感想 arxiv.org 概要 Google が2017年ごろに出したTransformer の論文 RNN、encoder-decoderモデル にAttentionと呼ばれる機構を追加したことによって、計算量を減らしながら精度を保つことに成功した Attentionというのは「注意機構」と呼ばれ、入力の…

マルチモーダルLLMであるMedLMの提供が開始

概要 感想 www.itmedia.co.jp cloud.google.com 概要 医療向けに特化したLLMとしてGoogleが「MedLM」として提供を開始した。 VertexAI でプレビュー版が使用可能になる MedLM の 2 つのモデルのうち 1 つは大規模で、複雑なタスクにおける活用を想定し設計さ…

ゴミ弁別用のQ&AにChatGPTが回答するシステムの導入断念

概要 感想 概要 news.yahoo.co.jp 香川県三豊市でChatGPTを用いたゴミ弁別のQ&Aを行うシステムの実証実験の結果が、目標の精度である99%に行かず、システムの導入を見送ったという話である。 以前CEATEC 2023 の松尾豊氏の講演でも、ChatGPTの活用事例として…