【論文紹介】JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

論文

arxiv.org ・学会発表用として投稿された日本語版のproceeding https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/C3-5.pdf 概要所感余談概要テキストと図表を含む日本語版のドキュメントのVQAデータセットを作成し、それらを用いて近年の主…

2024-03-30

人工言語による事前学習を用いた言語間転移可能な知識の分析

論文

www.jstage.jst.go.jp 昨日、ベッドの上で寝ながら読んでいたが面白かった。概要所感概要人工言語を用いた事前学習をTransformerのエンコーダに学習させ、そのエンコーダを自然言語の言語モデリングに転移したときの性能を測定させた論文。先行研究の結…

2024-03-17

アルツハイマー病研究、失敗の構造

本

アルツハイマー病研究、失敗の構造作者:カール・ヘラップみすず書房 Amazon 読み終えたので所感を。所感所感アルツハイマー病の特効薬がなぜ出来ないのか、というテーマを基に、アルツハイマー病の歴史、それらにまつわる主題な研究、定義も含めたこれ…

2024-03-12

E資格 2024 #1　受験レポ

E資格

www.jdla.org 受験し合格したのでレポート。（追記：Qiitaにも初投稿、このブログ記事の内容を少し修正した) qiita.com 背景勉強について受験について受験申込みについて受験会場について受験について所感背景受験理由：会社の業務の都合上、必要と…

2024-03-08

GCPのメモ　2/n

GCP

概要概要 Cloud Audit Logs: リソースの作成・データの読み取りなどの操作がログとして記録不正アクセス・データ漏えいなどの有無プロジェクト、フォルダ、組織ごとに保管される種類：管理アクティビティ監査ログ：リソース構成やメタデータの更新に関…

2024-03-05

GCPのメモ Compute Engine 1/n

GCP

概要概要 Compute Engine: 仮想増しをコンピューティングリソースとして提供するプロダクト。個々の仮想マシンはインスタンスと表される。料金体系は、インスタンスの起動時間やインスタンスに設定したvCPU・メモリなどに応じて課金される従量課金となって…

2024-03-04

Langchain を触ってみる

動画技術書

www.udemy.com LangChain を触っている。学習途中ではあるが、簡単にメモ。概要所感概要講義元では「gpt-3.5-turbo」を使っているが、それ以外のモデルでも使うことは可能但し記述を少し変えなくてはならない例えばhuggingfaceのモデルではhuggingface…

2024-02-24

gemma を使ってみた

技術系記事の紹介 Deep Learning

cloud.google.com Geminiと同様の方法で作られた軽量モデル「Gemma」を使ったという話。所感 IgakuQA と呼ばれる医師国家試験用のデータセットを使って、Gemmaに解かせてみた使ったモデルはgemma-7b-it 参考したページは以下の通り特定のモデルでデータセ…

2024-02-09

最強DB講義　大規模言語モデルの基礎・最新動向

動画技術系記事の紹介

dblectures.connpass.com だいぶ前に参加したオンライン講義である。本当は聞いた当日にでも書こうと思ったのだが、この講義を聞いている途中に体調を崩し、今日ようやくアーカイブを見て最後まで確認することが出来た。一応、参加者だけにリンクを知らさ…

2024-02-08

R-CNN, Fast R-CNN, Faster R-CNN の流れ

用語 Deep Learning E資格

概要余談概要物体検出モデルは、画像内に写っている物体の分類及び位置を行う R-CNN: Selective Searchにより物体の位置の候補領域を求める。その後、各領域をCNNに入力して、特徴マップを取得し特徴マップと教師を用いて、SVMにより分類し、領域 (バウン…

2024-01-30

VertexAI Search and Conversation の Search と Conversationの違いとは

GCP

cloud.google.com 概要余談概要 GCPの生成AI向けのサービスである、Search and Conversation。よく纏めて紹介されているのを見るが、SearchとConversationの違いは何なのか気になり調べ Searchは「入力テキストに対して、ストレージの非構造化データ、BigQ…

2024-01-14

C++ の vector から要素を完全に取り除く方法

leetcode コード

leetcode.com この頃コードを書く習慣が無くなってきているので、思い出しついでにLeetCodeの簡単な問題から解いて、感覚を取り戻している。今日は、冒頭のリンク先の問題である「すでに数値が入っている配列から、指定した数値を取り除いた配列にする」問…

2024-01-12

【3章以降】世界一エンジニアの思考法

本

sumidare.hatenablog.com 前回の記事の続き．残りの箇所を読み終えたので，概要と所感を記述する．概要感想概要マルチタスクは生産性が最低なのでやらない「今手を付けている仕事を1つに限定する」一日4時間は自分だけの時間を確保する teams，メール…

2024-01-10

【1章から3章の途中まで】世界一エンジニアの思考法

本

所感世界一流エンジニアの思考法 (文春e-book) 作者:牛尾剛文藝春秋 Amazon 所感 amazonにてセールが行われていたので、何かと話題になっている本を購入した。現状まだ途中までしか読めていないが、為になる話が幾つかあったのでまとめてみる。どんなに…

2024-01-06

【道具紹介】デスク付きのエアロバイク

購入した道具類

www.alinco.co.jp デスク付きのエアロバイクを購入し、今日届いた漕ぎながら、作業が出来るという優れもの少し使ってみた感想としては以下の通り音が静かなので、家の中で何時でも漕げるデスクが大きくノートPCぐらいなら余裕で置けるまたタブレットな…

2024-01-06

【用語】再帰型ニューラルネットワークに関する用語

用語

E資格の勉強にしており、それらの用語のまとめる (記事の水増しという）エコーステートネットワーク：入力の重みと隠れ層の重みをランダムな値で固定し、出力の重みのみを学習する。シンプルな線形回帰の問題になり、購買消失や勾配爆発が発生しなくなり、…

2024-01-06

【論文紹介】AIJack: Security and Privacy Risk Simulator for Machine Learning

論文

arxiv.org 概要所感概要機械学習モデルの学習・運用におけるセキュリティ・プライバシーリスクをシミュレーションしてくれるオープンソースのライブラリその名をAIJack github.com 例えばMLモデルの入力データに目立たないノイズを乗せて誤認識させるEva…

2024-01-03

【論文紹介】Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4:　精度向上のための２６のプロンプトの原則

論文

arxiv.org github.com 明けましておめでとうございます。概要 LLMの回答精度を向上させるための「２６のプロンプト原則」を紹介する論文 Table1 引用以下の５つのカテゴリに分けて、２６の原則について説明している。プロンプトの構造と明瞭さ 2. プロン…

2023-12-31

終盤から始めたブログの意義と学習の成果

ポエム

概要概要 2023年の終盤から始めたこのブログの意義について，今更ながら書いてみる実は単純に特筆すべきネタがない無くはないが，わざわざ纏めるまでのところまで行ってないこのブログを始めた理由は主に3つ学んだ内容をアウトプットすること見つけた…

2023-12-28

【論文紹介】Gemini: A Family of Highly Capanble Mutimodal Models

論文

概要所感 arxiv.org ざっと目を通したので概要と所感を記す．概要 Googleが出したマルチモーダルモデルの「Gemini」に関する論文マルチモーダルモデル，というのはテキスト，画像，音声，動画というように異なる形式データを同時に扱って出力するモデル．…

2023-12-27

プロンプトインジェクションによる事例

技術系記事の紹介

概要感想 note.com 概要プロンプトインジェクションによる被害について解説したnote 海外のディーラーのHPに設置したセールチャットボットに対してプロンプトインジェクションを仕掛けたという事例カスタマイズの無料サービスや新車を1$で売ることを確約…

2023-12-23

GCP リージョンとゾーン

用語 GCP

概要概要 GCPにおける「リージョン」と「ゾーン」についてまとめるリージョン：データセンターが置かれている地理的なエリアを指す単位。ゾーン：リージョンの中に存在している、独立して稼働が可能なコンピューティングリソースのグループを示す単位。 …

2023-12-22

DI (Dependency Injection) とは？

用語

概要参考概要 DI (Dependency Injection) についてまとめた依存性の注入とも呼ばれる私の解釈には「あるプログラムが別のプログラムの関数を持ってくる」ことで、別々にプログラムを作ることで、全体として疎結合なプログラムにすることだと思っている N…

2023-12-21

【論文紹介】Deep Learning 、そしてGemini のpaperが出た

論文時事

www.nature.com 概要感想その他概要 2015年のDeep Learning のレビュー論文教師学習、逆誤差伝播法、CNN、RNNといった深層学習の基礎中の基礎を述べているレビュー論文大事だと思った内容機械学習：カーネルメソッドのような非線形特徴を用いると、ト…

2023-12-20

Googleのプロンプト設計戦略

技術系記事の紹介

ai.google.dev 概要感想概要 Googleからプロンプト設計に関するドキュメントが出ていたプロンプトの例を出しながら、目的に対して適切な解答を得るための設計の工夫が書かれている明確な指示を出す例を含める多くの例を出しすぎると過学習を起こすア…

2023-12-19

【技術書】リーダブルコード

技術書

概要感想リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice) 作者:Dustin Boswell,Trevor Foucher オライリージャパン Amazon 概要リーダブルコードを読んだ相当前に買っておいて、積読していた仕事でコ…

2023-12-18

Skills boost のGSP313が難しかった

GCP

概要感想 partner.cloudskillsboost.google 概要 skills boostにあるGSP313「クラウドのリソースを作成、管理する：チャレンジラボ」のタスク3 HTTPロードバランサを設定するが難しかった ACEに関する学習で行っていたとにかく手順が分かりにくいのと、そ…

2023-12-17

【論文紹介】Attention is All You Need

論文

概要感想 arxiv.org 概要 Google が2017年ごろに出したTransformer の論文 RNN、encoder-decoderモデルにAttentionと呼ばれる機構を追加したことによって、計算量を減らしながら精度を保つことに成功した Attentionというのは「注意機構」と呼ばれ、入力の…

2023-12-16

マルチモーダルLLMであるMedLMの提供が開始

時事

概要感想 www.itmedia.co.jp cloud.google.com 概要医療向けに特化したLLMとしてGoogleが「MedLM」として提供を開始した。 VertexAI でプレビュー版が使用可能になる MedLM の 2 つのモデルのうち 1 つは大規模で、複雑なタスクにおける活用を想定し設計さ…

2023-12-15

ゴミ弁別用のQ&AにChatGPTが回答するシステムの導入断念

時事

概要感想概要 news.yahoo.co.jp 香川県三豊市でChatGPTを用いたゴミ弁別のQ&Aを行うシステムの実証実験の結果が、目標の精度である99%に行かず、システムの導入を見送ったという話である。以前CEATEC 2023 の松尾豊氏の講演でも、ChatGPTの活用事例として…

大福餅

大福餅

【論文紹介】JDocQA: Japanese Document Question Answering Dataset for Generative Language Models

人工言語による事前学習を用いた言語間転移可能な知識の分析

アルツハイマー病研究、失敗の構造

E資格 2024 #1　受験レポ

GCPのメモ　2/n

GCPのメモ Compute Engine 1/n

Langchain を触ってみる

gemma を使ってみた

最強DB講義　大規模言語モデルの基礎・最新動向

R-CNN, Fast R-CNN, Faster R-CNN の流れ

VertexAI Search and Conversation の Search と Conversationの違いとは

C++ の vector から要素を完全に取り除く方法

【3章以降】世界一エンジニアの思考法

【1章から3章の途中まで】世界一エンジニアの思考法

【道具紹介】デスク付きのエアロバイク

【用語】再帰型ニューラルネットワークに関する用語

【論文紹介】AIJack: Security and Privacy Risk Simulator for Machine Learning

【論文紹介】Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4:　精度向上のための２６のプロンプトの原則

終盤から始めたブログの意義と学習の成果

【論文紹介】Gemini: A Family of Highly Capanble Mutimodal Models

プロンプトインジェクションによる事例

GCP リージョンとゾーン

DI (Dependency Injection) とは？

【論文紹介】Deep Learning 、そしてGemini のpaperが出た

Googleのプロンプト設計戦略

【技術書】リーダブルコード

Skills boost のGSP313が難しかった

【論文紹介】Attention is All You Need

マルチモーダルLLMであるMedLMの提供が開始

ゴミ弁別用のQ&AにChatGPTが回答するシステムの導入断念