タグ

論文に関するdeejayrokaのブックマーク (34)

  • 科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待

    近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99%減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に特化したAIモデル「OpenScholar」をリリースしました。 Ai2 OpenScholar https://openscholar.allen.ai/ Ai2 OpenScholar: Scientific literature synthesis with retrieval-augmented language models | Ai2 https://allenai.org/blog/openscholar OpenScholar: The open-source

    科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待
    deejayroka
    deejayroka 2024/11/24
    "OpenScholarはそんな科学者の負担を軽減するため、ユーザーのクエリに応じて関連する論文を見つけ出し、その内容に基づいた回答を生成してくれるAIモデル"
  • Sakana AI

    Sakana AIは、自然から着想を得たアプローチで最先端の基盤モデルを進化させるという分野を切り開いてきました。今年の3月には、大規模言語モデル(LLM)を含む複数の基盤モデルの統合を自動化する方法を開発し、さらに6月には、LLMを使って、LLMをより効率的にトレーニングする方法を発見しました。 The AI Scientist そして今回我々は、「LLMを使って、研究開発プロセスそのものの自動化する」という革新的な技術を開発しました。我々は、これを「The AI Scientist」(AIサイエンティスト)と命名し、オックスフォード大学とブリティッシュ・コロンビア大学との共同研究により、「The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery」という論文にまとめて公開しました。ソースコードもオー

    Sakana AI
  • ChatGPTが論文のライティングスタイルにもたらした変化|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

    Preprintあげたのでご報告!📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。 (限界助教先生の記事面白かったです、以下👇参照)https://t.co/aYK0KDgJ7L… pic.twitter.com/ognOJecixR — 松井健太郎 睡眠・精神医学 (Kentaro Matsui) (@matsuikentaro1) May 17, 2024 論文執筆は、多くの研究者にとって時に苦痛を伴う作業です。英語を母語としない研究者にとっては特に、言語の壁が大きな障害となります。ChatGPTは、この障壁を一気に取り払ってくれます。翻訳、校正、要約作成—かつては数日を要したこれらの作業が、数分で完了する。その魅力は、抗いがたいものです。 特定の分野、特にコンピューターサイエンスや工学系の論文において、ChatGPT特有

    ChatGPTが論文のライティングスタイルにもたらした変化|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
  • LLMで学習不要のレコメンドエンジンを実現

    導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 記事では、LLMを使用したレコメンドエンジン作成のフレームワークについて、簡潔に解説していきます。 サマリー LLMを使用したレコメンドエンジン作成のフレームワーク(以降、「提案されたレコメンドエンジン」)は、Amazonの研究チームによって発表された論文で提唱されました。 このレコメンドエンジンの特徴は、ファインチューニングを利用していないLLMとユーザーの行動(商品のクリックなど)情報を元に、レコメンドの性能を継続的に改善できる点です。ユーザーの行動をもとに、LLMにより関連性の高い商品を推測させることでレコメンドの性能を上げています。 より詳細な解説は以下の記事、もしくは論文を参照してください。

    LLMで学習不要のレコメンドエンジンを実現
    deejayroka
    deejayroka 2024/07/05
    “提案されたレコメンドエンジンは、レコメンド対象のアイテムに対する質問と当該のアイテムが選択された確率をLLMにわたすことで、より適切な質問を生成するというフローを繰り返していきます。”
  • RAG評価ツール「RAGAS」の論文を読む

    記事では、RAG評価ツールの「RAGAS」の論文ついてざっくり理解します。軽めの記事です。 株式会社ナレッジセンスでは、生成AIやRAGシステムを活用したサービスを開発しており、その中でもRAG精度の評価は非常に重要です。 この記事は何 この記事は、「RAGAS」についての論文[1]を、日語で簡単にまとめたものです。RAGASはツールとして有名ではあるものの、RAGASの論文を読んだことがある方は多くなさそうです。 RAGASとは、おそらく今、一番有名なRAG評価ツールです。同様のツールとして、他にはLangSmithやARESが有名かと思いますが、他の開発者と話をしていても、評価ツールとして一番に名前が上がりやすいのは、やはりRAGASです。 また、今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー R

    RAG評価ツール「RAGAS」の論文を読む
    deejayroka
    deejayroka 2024/06/03
    “RAGの評価を複数のパートに分類したことと、それぞれのパートでLLMを活用して「自動で」評価できるようにした点です。また、細かい補足ですが、この手法ではLLMだけでなく、Embeddingも用いられています。”
  • GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが実

    GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
  • ソフトウェアエンジニアリングにおけるLLMの適用に関する最新論文調査【技術動向調査】 - Platinum Data Blog by BrainPad

    ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、ソフトウェアエンジニアリングにおける作業の自動化と効率化に向けたLLMの適用をトピックにメイン論文と関連論文を紹介します。 目次 今回のトピック メイン論文 要件工学と設計 コード生成と補完 ソフトウェアテスティング ソフトウェアのメンテナンス ドキュメント生成とコード要約 全体要約&結論 こんにちは、アナリティクスコンサルティングユニット所属の金です。 現在ブレインパッドではLLM関連の論文の調査を行っています(LLM論文レビュー会)。 今回は、ソフトウェアエンジニアリングにおけるLLMの適用をトピックにメイン論文と関連論文を紹介します。 今回のトピック ソフトウェア

    ソフトウェアエンジニアリングにおけるLLMの適用に関する最新論文調査【技術動向調査】 - Platinum Data Blog by BrainPad
  • Eureka - LLMで報酬を自動生成してロボットを学習させるAIエージェント|npaka

    以下の記事が面白かったので、かるくまとめました。 ・Eureka! NVIDIA Research Breakthrough Puts New Spin on Robot Learning 1. Eureka「NVIDIA Research」が開発した、ロボットに複雑なスキルを学習させることができる新しいAI エージェントは、ロボットハンドにペン回しを教えることができました。 これは、ロボットを学習させるための報酬アルゴリズムを自律的に作成する 「Eureka」のおかげで、ロボットが達成できるようになった30近くのタスクのうちの1つになります。引き出しやキャビネットを開ける、ボールを投げる、キャッチする、ハサミを使うなどの作業も覚えました。 公開された「Eureka」の研究には、論文とプロジェクトAI アルゴリズムが含まれており、開発者は強化学習研究用の物理シミュレーション リファレン

    Eureka - LLMで報酬を自動生成してロボットを学習させるAIエージェント|npaka
  • AIマップ

    AI Map English Download AI Map Beta 2.0 English (Sep. 1, 2021) Read more » AIマップβ2.0 AI研究初学者と異分野研究者・実務者のための課題と技術の俯瞰図 AI(Artificial Intelligence)研究は拡大し、全体を俯瞰的に捉えることが難しくなっている。また、AI研究の成果を用いた多数のシステム(AIシステム)が実社会で活用され始めており、AIシステムとAI技術との対応も把握が難しくなっている。そこで、これから活躍するAI研究の初学者、およびAI活用を狙う異分野の研究者・実務者をターゲットとしたガイドとして、AIマップβ2.0を作成した。AIマップβ2.0は、2019年に発刊したAIマップβの発展版であり、AI課題マップと、AI技術マップの2種から構成される。概要を以下に示す。 【AI課題マップ】

  • 勤務時間の10%を「探索」活動に。急成長スタートアップが実践するイノベーションの生み出し方

    今や企業が成功するには、ただ単に良い製品やサービスを提供するだけでは不十分だ。継続的なイノベーションによって、消費者ニーズの変化についていく必要がある。 しかし、それは簡単なことではない。日々の業務をこなしながら次の大事業を思いつくなんて従業員にはハードルが高い、と多くの企業は思うだろう。 だが賢い企業は、イノベーションが「探索」と「実験」から生まれること、そして良い結果にはある程度の「失敗」が伴うことを理解している。 「Facetune(フェイスチューン)」という写真編集アプリを開発したライトリックス(Lightricks)は、実験に真剣に取り組んでいる。イスラエルに拠点を構える同社は、テッククランチTechCrunch)によればシリーズDで1億3000万ドル(約173億円、1ドル=133円換算)を調達し、現在のバリュエーションは18億ドル(約2400億円)だ。同社の社員は全員、勤務時

    勤務時間の10%を「探索」活動に。急成長スタートアップが実践するイノベーションの生み出し方
  • Notionでの論文管理をサポートするツールを作りました - Qiita

    変更履歴 231108 現在、Pythonのバージョンが3.12だとpipでのインストールに失敗することがあるようです。 バージョン3.10または3.11のPythonを使うのがオススメです。 詳細を記載しました。 インストールの失敗について、ご報告いただきありがとうございました。 230614 Notionデータベース作成の方法に誤りがあったため修正しました。 Firstプロパティも、Selectタイプにする必要があります。 ご指摘ありがとうございました。 前置き 私はこんな感じでNotionを使って論文の管理をしているのですが、 その際に使っているPythonプログラムをコマンドラインツールとしてまとめて、配布してみました。 その名も Papnt です。 所詮素人が作ったプログラムなので大目に見てください。 このプログラムを使った結果について、一切責任は取れません。 なにができるの?

    Notionでの論文管理をサポートするツールを作りました - Qiita
  • Generative Recommendation : LLMを活用した推薦システム | Wantedly Engineer Blog

    この記事はWantedly Advent Calendar 2023 兼 情報検索・検索技術 Advent Calendar 2023の3日目の記事です。 ウォンテッドリーでデータサイエンティストをしている角川(@nogawanogawa)です。ウォンテッドリーのデータサイエンスチームは、9/18〜9/23にシンガポールにて開催されたRecSys2023に聴講参加しました。 RecSys 2023, the seventeenth conference in this series, will be held in Singapore. It will bring together researchers and practitioners from academia and industry to present their latest results and identify new

    Generative Recommendation : LLMを活用した推薦システム | Wantedly Engineer Blog
    deejayroka
    deejayroka 2023/12/04
    "Generative Recommendation: LLMそれ自体を推薦システムとして使用する方法 (LLM as RS)"
  • LangChainを使ってHyDEによるクエリ変換の効果を検証する - Ahogrammer

    ChatGPTやGPT-4をはじめとする大規模言語モデルの能力が向上し、多くの注目を集めています。とくにRAG(Retrieval Augmented Generation)と呼ばれる手法を使って、手元のデータを生成時に活用する手法がよく使われていますが、その性能を改善する方法は様々あります。その中でも、この記事ではRAG内部の検索性能を改善するためのクエリ変換に着目し、HyDEと呼ばれる手法の効果を日語の検索用データセットを使って検証した結果を示します。 記事の構成は以下のとおりです。 HyDEとは 実験設定 実験結果 実装の詳細 参考資料 HyDEとは HyDE(Hypothetical Document Embeddings:仮の文書の埋め込み)は、入力されたクエリに対して仮の文書を生成し、その文書を埋め込み、検索に使用する手法です[1]。典型的な文書検索では、ユーザーが入力したク

    LangChainを使ってHyDEによるクエリ変換の効果を検証する - Ahogrammer
  • ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 | AIDB

    ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 2023/11/13 AI論文解説 LLM プロンプト AIDB Research 記事では、大規模言語モデル(LLM)に対するユーザーの質問・指示に対する応答の質を向上させる新しい手法「RaR(Rephrase and Respond)」について、論文をもとに紹介します。研究はカリフォルニア大学ロサンゼルス校(UCLA)の研究者によって発表されています。 「RaR」は、LLMがユーザーの質問を自身が理解しやすい形に自ら言い換える手法で、GPTシリーズ(GPT-4、GPT-3.5)など複数のLLMで効果が確認されています。 RaRの実行プロンプトは比較的シンプルであり、LLMに質問の言い換えと回答を一度に行わせることが可能です。 以下ではRaRの研究背景、理論、実行プロンプト例、実験の内容と結果、デモン

    ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 | AIDB
    deejayroka
    deejayroka 2023/11/14
    “LLMに対して、人間の質問を自分で言い換えて応答させるためのプロンプト指示「RaR(Rephrase and Respond)」という新しい方法を提案”
  • DeepMindが作った平凡な性能のAI「Gato」、何がすごいのか

    最近では、深層学習を使った人工知能AI)のブレークスルーについてのニュースを頻繁に見かけるようになった。しかし、Alphabet傘下のDeepMindが発表した最新の成果のすごさは分かりにくい。この研究の成果を一言で要約するとすれば、「多くのタスクでそれなり仕事ができるAI」を作ったということになるだろう。 「Gato」と名付けられた最近発表されたDeepMindのプログラムは、いわゆるマルチモーダルなAIで、テレビゲームをプレイしたり、チャットをしたり、文章を書いたり、写真にキャプションを付けたり、ブロックを積み上げるロボットアームを制御したりすることができる。Gatoは、1つのニューラルネットワークで複数の種類のデータを扱い、複数の種類のタスクを実行する能力を持っている。 プレプリントの論文を発表するサーバー「Arxiv」に投稿された「A Generalist Agent」と題する論

    DeepMindが作った平凡な性能のAI「Gato」、何がすごいのか
    deejayroka
    deejayroka 2023/11/10
    “「Gatoは、1セットの重みで、対話を行ったり、画像にキャプションを付けたり、本物のロボットアームでブロックを積み上げたり、Atariのテレビゲームを人間よりも上手にプレイしたり、シミュレーションされた3D環境でナ
  • Generative Agents の論文を読んで、その仕組みをドキュメント問い合わせシステムとして応用してみた - Qiita

    Generative Agents の論文を読んで、その仕組みをドキュメント問い合わせシステムとして応用してみたOpenAI箱庭ChatGPTlangchain モチベーション こちらで紹介されていた「Generative Agents: Interactive Simulacra of Human Behavior」という論文を読み、大変興味を持ちました。 AIによって生成された25名のエージェント(ChatGPT: gpt3.5-turbo)が人間の行動をシミュレートして、社会的な行動が創発されたそうです。 この論文での創発の定義は以下でした。 情報拡散(Information Diffusion) 関係性の記憶(Relationship memory) 調整(Coordination) また、このような創発を起こすためのエージェントの仕組みは、以下あたりでと解釈しました。 外部記憶(

    Generative Agents の論文を読んで、その仕組みをドキュメント問い合わせシステムとして応用してみた - Qiita
    deejayroka
    deejayroka 2023/09/26
    “より抽象度の高いレベルの洞察や思考に昇華された記憶がとても重要(Reflection) ”
  • 生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版 - Platinum Data Blog by BrainPad

    記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。現在は、週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビュー会の内容をピックアップのうえ配信しています。 今回は、ツール拡張をテーマに、4つの論文をご紹介します。 目次 今回のテーマ Lost in the Middle: How Language Models Use Long Contexts 選定理由 論文概要 どうやって入力コンテキストをどのように使用するか調べたの? 結局コンテキストが長いほどいいのか? レビュー会FB Q: Attention

    生成AI・LLMのツール拡張に関する論文の動向調査 2023年8月版 - Platinum Data Blog by BrainPad
  • 1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第10回目はAIによるソフトウェア開発支援、音声を理解できる言語モデル、人物画像学習の新たな手法など、5つの論文をまとめました。 生成AI論文ピックアップテキスト指示からソフトウェアを自動開発するチャットベースのAIフレームワーク「ChatDEV」 人が話す声とやり取りする大規模言語モデル「LLaSM」 テキスト指示で高品質な動画編集ができるAI「MagicEdit」 中国ByteDanceの研究者らが開発 顔の特徴を保持した新しい人物写真を生成するAI「FaceChain」 中国アリババグループの研究者らが開発 映像内の動く人や物を分離する手法「VideoCutLE

    1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
  • ChatGPTと協創!arXiv論文要約ツールを作ってみた - Qiita

    はじめに こんにちは。(株) 日立製作所の Lumada Data Science Lab. の諸橋 政幸です。 最近、AI技術の進歩により、様々なタスクが効率化されています。その中でも、「ChatGPT」 は自然言語処理の分野で革新的な成果を上げており、大きな注目を集めています。 今回は、このChatGPTを活用してarXiv論文の要約を生成する簡易ツールを作成してみたので、そのプロセスを共有します。記事の構成は以下のとおり。 ChatGPTにやりたいことを伝えてみる 生成コードを修正して期待通り動くようにする ツール名も考えてもらう とにかく 「ChatGPTに積極的に頼る!」 をコンセプトにして作りました。 土日に趣味でやったのでツールのレベルや実用性については深く考えないでください! その前に自己紹介(+のアピール) 私は日立製作所で顧客課題をデータ分析を使って解決する業務を行

    ChatGPTと協創!arXiv論文要約ツールを作ってみた - Qiita
  • GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad

    記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、GPT-4の登場から執筆日(2023年5月31日時点)までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきます。 LLM/ChatGPTの動向 オープンソースLLM モデル オープンソースLLMの調整 Adapter、LoRA Instruction Tuning Human Feedback プロンプトエンジニアリング プロンプトエンジニアリングの課題①:プロンプトに大量の情報を入れられない プロンプトエンジニアリングの課題②:複雑なタス

    GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad