タグ

tokadaのブックマーク (22,845)

  • SSHでも二要素認証を使いたい | IIJ Engineers Blog

    社会人生活の半分をフリーランス、半分をIIJで過ごすエンジニア。元々はアプリケーション屋だったはずが、クラウドと出会ったばかりに半身をインフラ屋に売り渡す羽目に。現在はコンテナ技術に傾倒中だが語りだすと長いので割愛。タグをつけるならコンテナ、クラウド、ロードバイク、うどん。 【IIJ 2024 TECHアドベントカレンダー 12/6の記事です】 今年のIIJアドベントカレンダーは「運用」がテーマということなので、運用に欠かせない必携ツール筆頭であるSSHを取り上げ、SSHの秘密鍵を安全に管理する方法について考えたいと思います。 たとえSSH秘密鍵が漏洩しても、安全を確保する方法 踏み台サーバにSSH秘密鍵を置かずに利用する方法 SSH秘密鍵の安全な置き場所を考える SSH秘密鍵は一般的に ~/.sshにファイルとして管理されていると思いますが、不安に感じることはありませんか? ノートPC

    SSHでも二要素認証を使いたい | IIJ Engineers Blog
    tokada
    tokada 2024/12/07
  • LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 | Ledge.ai
    tokada
    tokada 2024/11/17
  • 生成AI、実在しない観光名所紹介 福岡市後援の官民連携サイト | 毎日新聞

    誤った記事が掲載された「福岡つながり応援」のサイト画面。福岡市や福岡県飯塚市の後援が表記されているが、現在は消えている 福岡県の魅力を発信する目的で今月開設されたサイトに、実在しない観光名所やご当地グルメが紹介された。記事は生成人工知能AI)で作成していたといい、サイトを運営していた東京のウェブ関連会社は、事実と異なる記事だったとして全記事を削除して謝罪。サイトを後援していた福岡市と福岡県飯塚市は、事態を重く見て後援を相次いで取り消した。魅力を伝えるはずが、なぜ誤情報の発信となったのか。 問題となったのは「官民連携」のキャンペーンをうたうインターネットサイト「福岡つながり応援」。沖縄や宮城、山口各県の応援サイトを運営するウェブ関連会社が、11月1日から福岡県向けを新たにスタートさせ、県内の観光情報を掲載した。 ところが、閲覧者が保存した画像によると、福岡市の紹介記事では、アミューズメント

    生成AI、実在しない観光名所紹介 福岡市後援の官民連携サイト | 毎日新聞
    tokada
    tokada 2024/11/17
  • 医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話

    どんな人向けの記事? 医薬品のような難しい検索ニーズにこたえるためにベクトル検索を利用する知見を見てみたい MySQLの全文検索と、ベクトル検索の精度や速度を比較してみたい ベクトルDBEmbeddingモデルを利用した簡単なベクトル検索の実装方法を知りたい 医薬品の検索ニーズは多様なので、ベクトル検索で解決できるか試したい 1つの医薬品を指す名称は、複数存在するため医薬品検索は意外と面倒な問題です。 例えば、日人なら頭痛や生理痛、発熱したときに「ロキソニン」を飲んだことがあるかもしれません。この名称は商品の名称ですが、成分の名称は「ロキソプロフェンナトリウム水和物」です。 さらに、ロキソプロフェンには錠剤以外にもテープやパップといった剤形の違いがあります。 そして最後に、ロキソプロフェンを作っている会社は複数あるので、末尾に「トーワ」や「ファイザー」などの組み合わせが存在します。ロキ

    医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話
    tokada
    tokada 2024/09/19
  • ソースコードをリポジトリ丸ごとLLMに読んでもらう方法

    はじめに ソースコードをLLMに読んでもらうとき、単一ファイルだと楽なのですが、GitHubのリポジトリのように複数ファイルから構成されるプロジェクトだと困ってしまいますね。 リポジトリごとLLMに読んでもらえるようにいい感じにテキスト化できると良いですね。そんなソフトがありました。しかも2つ。 両方ともほとんどコンセプトは同じです。特に後者のgenerate-project-summaryは使い方も含めて、自分のやりたいことが、すでに開発者の清水れみおさんが以下の記事にまとめていました。 なので、あんまり書く必要ないのですが、せっかくなのでgpt-repository-loaderの使い方と、出力したファイルの別の活用方法について書いてみたいと思います。 gpt-repository-loaderでリポジトリをテキストに変換 使い方はREADMEに書いてあります。シンプルなソフトなので、

    ソースコードをリポジトリ丸ごとLLMに読んでもらう方法
    tokada
    tokada 2024/09/01
  • 「オープンソースAI」問題ついに決着、OSIが定義を発表

    これまで明確な定義がなかった「オープンソースAI」の定義をオープンソース・イニシアティブ(OSI)が発表した。テック企業が「オープンソース」という言葉を都合よく使っているとの批判への回答となるか。 by James O'Donnell2024.08.26 10 この記事の3つのポイント オープンソースAIの定義がOSIにより発表された 定義はAIモデルの使用、検査、修正、共有の自由を規定している 訓練データの透明性については意見の相違があり折衷案となった summarized by Claude 3 オープンソースAIは現在、至る所に存在する。問題は、実際のところそれが何なのかということについて、意見が一致していないことだ。今、私たちはようやくその答えを得られたかもしれない。オープンソースであることの意味の裁定者を自任するオープンソース・イニシアティブ(OSI)が、新しい定義を発表したのだ

    「オープンソースAI」問題ついに決着、OSIが定義を発表
    tokada
    tokada 2024/08/27
  • 「カフェイン飲料+甘味」で体内時計に大きな遅れ、広島大学の研究で明らかに──昼夜逆転したマウスも

    研究チームは「カフェイン摂取により、夜眠れなくなり、遅寝・遅起きな生活リズムになってしまう可能性を示唆するだけでなく、カフェイン飲料への甘味の追加が、さらにその影響を悪化させることを示す結果」としている。 研究成果を発表したのは、広島大学大学院医系科学研究科、公衆衛生学の田原優准教授らの研究チーム。論文は学術誌「npj Science of Food」に19日付で掲載された。 【訂正:2024年8月20日18時24分更新 ※誤記を修正しました】 関連記事 「お酒のエナジードリンク割りは危険」農水省が注意喚起 原因はYouTuber? 問い合わせ相次ぐ お酒とエナジードリンクを一緒に飲むとカフェインの過剰摂取による健康被害につながりかねないとして、農林水産省が注意喚起している。5月8日に問い合わせが相次いだことを受けての対応で、同省は直前に人気YouTuberがお酒とエナジードリンクを一緒に

    「カフェイン飲料+甘味」で体内時計に大きな遅れ、広島大学の研究で明らかに──昼夜逆転したマウスも
    tokada
    tokada 2024/08/20
  • Linux コンテナの歴史を追うとコンテナの仕組みがわかる / Dai Kichijoji pm

    2024-07-13「大吉祥寺.pm」の発表資料です。 参考となる情報にはPDF中からリンクをしていますが、資料中のリンクは Speaker Deck 上ではクリックできないので PDF をダウンロードしてご覧ください。

    Linux コンテナの歴史を追うとコンテナの仕組みがわかる / Dai Kichijoji pm
    tokada
    tokada 2024/07/14
  • なんとなく言語 (学) に興味がある人のためのブックガイド|長屋尚典

    「なんとなく言語 (学) に興味がある人のためのブックガイド」をつくりました。 「なんとなく言語 (学) に興味があるのでもうちょっと読んでみたい」 「言語学にどんな分野があるのか知りたい」 「専門的に勉強したいというほどではないのだけれど、もうちょっと何か読んでみたい」 という人のために、言語 (学) についての入門的なを紹介します。 これらのを読んで言語 (学) っておもしろいなと思ったら、ぜひ大学などで言語学の授業を受けたり、専門的な入門書を読んだりしてください。 あるいは、以下の記事を参考に自分で言語学を勉強してみるとよいでしょう。 あくまで、なんとなく言語 (学) に興味がある人のためなので、注意点がいくつかあります。 網羅的なリストではありません。まだまだ編集中です。おもしろかったがあったら教えてください。 基的に和書で、一般向けのを紹介しています。 出版年順に並べて

    なんとなく言語 (学) に興味がある人のためのブックガイド|長屋尚典
    tokada
    tokada 2024/05/06
  • デプロイ再考2024/reconsidering-deploy-in-2024

    現在 estie では、デプロイの改善・統一に取り組んでいます。複数プロダクトのそれぞれの技術スタックが大きく違う中、どう考えたら効率的なデプロイを組めるのか。2024年のデプロイの原則について、あらためて考えてみました。

    デプロイ再考2024/reconsidering-deploy-in-2024
    tokada
    tokada 2024/02/25
  • 【AI動画生成】Sora 要素技術解説

    もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと

    【AI動画生成】Sora 要素技術解説
    tokada
    tokada 2024/02/17
  • 英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama

    はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は書けるのか?ゼロから書かせるのは難しいですが、日語の下書きを英訳するのは得意で、少なくとも筆者が満足する品質のテキストが得られます。 GPTを使って執筆をするメリットDeepLGoogle翻訳と違い、英文のスタイル(e.g., 論文調)を明示的に指示できるので、翻訳のクオリティが高い 日語ネイティブにとっては、日語で書いた方が圧倒的に楽※ スペルミスや文法ミスを犯さないので、校正の手間も減る。※ 基的に翻訳タスクしか行っていないので、GPTが過去の類似文章

    英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama
    tokada
    tokada 2024/01/07
  • 計算時間とメモリの壁を打破!Transformerの次世代モデルReformer

    3つの要点 ✔️ Local-Sensitive-Hashingにより必要な要素同士のAttentionを計算することができるようになった ✔️ Reversible layerによってレイヤー数に比例して増加するactivationを保存するメモリの削減 ✔️ transformerの計算量を$O(L^2)$から$O(L \log L)$まで削減した Reformer: The Efficient Transformer written by Nikita Kitaev, Łukasz Kaiser, Anselm Levskaya (Submitted on 13 Jan 2020 (v1), last revised 18 Feb 2020 (this version, v2)) Comments: ICLR 2020 Subjects: Machine Learning (cs.L

    計算時間とメモリの壁を打破!Transformerの次世代モデルReformer
    tokada
    tokada 2023/09/03
  • 日本語大規模言語モデル OpenCALM の知識でクイズ王に挑戦する | Amazon Web Services

    Amazon Web Services ブログ 日語大規模言語モデル OpenCALM の知識でクイズ王に挑戦する 数十億を超えるパラメーターを持つ大規模言語モデルは、追加学習なしに人間も驚く知識を披露します。その知識で、クイズ王に輝くことはできるのでしょうか? 記事では、株式会社サイバーエージェント様が公開した OpenCALM を用いてクイズを題材にした日語 QA データセット JAQKET にどこまで正確できるか検証します。クイズに回答するのは、問い合わせ窓口での質問回答業務に近いタスクです。記事の内容は、お客様対応等の業務を続々とオープンソースで公開される大規模言語モデルを利用してどのようにコスト効率良く改善するのかの検討にも活用頂けます。 OpenCALM は、株式会社サイバーエージェント様から 2023 年 5 月 11 日に公開された日語大規模言語モデルです。Wik

    日本語大規模言語モデル OpenCALM の知識でクイズ王に挑戦する | Amazon Web Services
    tokada
    tokada 2023/07/04
  • オープンソースLLMの日本語評価結果 - W&Bローンチで誰でも再現可能に|Weights & Biases Japan

    Weights & Biasesnoteをフォローしてください LLMの日語性能ChatGPTが発表されて半年あまりが経ち、世の中は激変しました。少し冷め始めていたAIへの注目は突然急騰し、この新しい技術の可能性を探究すべく、日では世界的にも突出した数の方々がその動向に関心を持っているようです。 ChatGPTは幅広い言語で高い性能を示している一方で、モデルは公開されておらず、またAPIの利用においてプライバシーや機密性の高いデータを送信することはできないため、オープンソースのモデルにも注目が集まっています。 オープンソースのモデルにもいくつかの系譜があります。 LLaMA:Meta社が公開したアカデミック向けのLLM (商用利用不可) GPT-NeoX:Eleuther AIの開発した完全にオープンソースな技術スタックで開発されたモデル Bloom:BigScienceプロジェク

    オープンソースLLMの日本語評価結果 - W&Bローンチで誰でも再現可能に|Weights & Biases Japan
    tokada
    tokada 2023/07/04
  • 外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog

    はじめに ABEJAでデータサイエンティストをしている服部です。 今回はLLMで外部データを使うケースについてのお話をしたいと思います。 はじめに LLMと外部データの利用 RetrievalとLLM 0. (事前準備)参照したいテキストデータをDBに格納 1. ユーザの入力文とのテキスト類似度を計算して、関連テキストを抽出する(Retrieval) 2. 関連テキストをLLMのプロンプトに入れ込み、ユーザの入力文に回答する。 Retrieval時の課題 LangChainでの用意 Case1: それぞれの文章がRetrievalしにくい形で保存されている 対策案: ページ構造を意識した形で各文章を格納する 他の対策案 聞き方を明確にする 類似度を測るクエリ文章を置き換える 不要そうな文章をデータから削除する データ自体をLLMで整形し直す Case2: 未知の単語を含む 仮説: ニャオハ

    外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog
    tokada
    tokada 2023/07/04
  • ChatGPT先生のお陰でネットワークスペシャリストに合格した話 - Qiita

    ※ 直近2年間で高度試験に合格していれば免除 攻略の定石 〜過去問〜 ChatGPTの話題の前に、受験する皆様に絶対に伝えておかねばならないネスペひいては情報処理技術者試験共通の対策定石があります。それは 過去問をやれ です。これに尽きます。 勉強スケジュールを決めるとか目標をどうのこうのとかありますがそれは人によって合う合わないがあります。 しかし過去問をやれだけは全人類共通の対策方法になります。特に午前問題は過去問に100%答えられるなら新規問題の割合は多くないので確実に合格します! 午後問題も、過去問と同じ単語を答えさせる問題が何回か出てくるので、「この単元・単語が好きなんだな」みたいな傾向がわかったりします。それ以上に 「どれぐらいの粒度でどのような観点の回答をすべきか」 を抑えることができるので、具体的な習得目標ができ、「全く過去問を解かなかった人」と比べると大きなアドバンテージ

    ChatGPT先生のお陰でネットワークスペシャリストに合格した話 - Qiita
    tokada
    tokada 2023/07/04
  • 【Streamlitよりいいかも?】機械学習系のデモアプリ作成に最適!Gradio解説 - 学習する天然ニューラルネット

    はじめに Streamlit vs Gradio Gradioの設計思想 Interface 入出力に応じたUI Interface String Shortcut 入力データのサンプルのセット ドキュメンテーション テーマの変更 タイムアウトへの対処 中級者への第一歩、デモを作る際に知っておきたい処理 Gradioが担当する前処理について プログレスバー もろもろの出力結果を保存するには? 認証認可(というか認可) その他、解説しないが需要の有りそうなもの まとめ 追記 : 動画になりました。 はじめに 機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。 同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上がってしまった。 ブログでは、G

    【Streamlitよりいいかも?】機械学習系のデモアプリ作成に最適!Gradio解説 - 学習する天然ニューラルネット
    tokada
    tokada 2023/07/04
  • 粘菌100万体の振る舞いを個別計算、ラット脳細胞で機械学習──ライゾマ真鍋氏が見せた「AIの少し先の未来」

    粘菌100万体の振る舞いを個別計算、ラット脳細胞で機械学習──ライゾマ真鍋氏が見せた「AIの少し先の未来」(1/4 ページ) 2022年の夏以降、世の中はAIアート作品の話題でもちきりだ。そんな中、AIブーム以前からAIを活用した作品も手掛けてきた真鍋大度氏の個展「EXPERIMENT」が4月から5月にかけて開催されていた。頭の中に浮かんだイメージを映像化した作品や、ラットの脳細胞をコンピュータ代わりに使う作品など、AIよりもさらに先の未来を予見させる作品ばかりだとして話題になった。 作品作りには高性能なコンピュータや光無線通信などの技術が必要だったが、2022年に設立されたソフトバンク先端技術研究所(以下、ソフトバンクR&D)がこうした技術を提供。まさに「技術の粋(すい)」が感じられる展覧会となった。そこで展示があった“AIの少し先の未来”を、ここでは詳しく紹介したい。 真鍋氏はクリエイ

    粘菌100万体の振る舞いを個別計算、ラット脳細胞で機械学習──ライゾマ真鍋氏が見せた「AIの少し先の未来」
    tokada
    tokada 2023/07/02
  • たくさんセキュリティチェックシートを書いていて悟りが開けそうなので途中経過を書いてみる - Qiita

    セキュリティチェックシートって大変ですよね 「契約締結目前で、今日もらったチェックシートを3日後までに出せば決まりです!」 「これNGだと契約できないんですけどなんとかならないですか?」 「(書いてもらったシートをレビュー中)え!?これOKじゃなくてNGですよ!?」 「書き始めたら8時間以上かかってるんですけどこれ無償対応なんですか・・・?」 っていうことありませんか!?ない!?良かったですね!!(血涙) ということで、結構セキュリティチェックシートで苦労しています。 過去にISMS認証を取得したときには「これでちょっとは楽になるな!よかった!」と思ったもんですが、 大きく楽になった感じはありません。 といっても、セキュリティチェックシートは次々来るので、なんとなく悟りが開けてきました。 ということで、道半ばではありますが、 そもそもセキュリティチェックシートってなんだっけ? なんで苦労し

    たくさんセキュリティチェックシートを書いていて悟りが開けそうなので途中経過を書いてみる - Qiita
    tokada
    tokada 2023/07/02