Whisperは、ChatGPTで知られるOpenAIによって開発された非常に正確な音声認識モデルで、会話の音声をテキストに書き起こしてくれる。 100万時間以上のデータでトレーニングされた最新のAIモデルだが、驚くべきことにオープンソースで公開されているため、誰でも、無料で、簡単に利用することができる。 有料の音声書き起こしサービス・議事録書き起こしサービスは数多くあるが、実は無料のWhisperを使えば十分だ。 むしろ、Whisperの方が殆どの音声認識ソフトより精度が高いだろう。 とはいえ、プログラミングの知識がない人にとっては、少し利用するハードルがある。 そこで、Whisperの最新モデル(Whisper v3)を、簡単に使える小さなWebアプリにしてみたので、この記事で使い方を紹介する。 Whisperを、Google ColabというGoogleアカウントを持っている人なら誰
OpenAIが開発している「Whisper」は、あらゆる言語で人間の会話音声を文字起こしできる高性能なSpeech-to-textモデルだ。 Whisperはオープンソース化されており、モデルをダウンロードすれば、無料で、誰でも利用できる。 しかし、実用上の大きな問題がある。 それは、文字起こしには相当なGPUパワーを要し、一般的なPCでは時間がかかりすぎるという点だ。 そこで当ブログでは、Google Colaboratoryの無料のGPUインスタンスで、Whisperを利用するノートブックを公開している。しかし、Google Colabの無料プランで使えるGPUでは超高速とはいかず、数十分の音声を日常的に文字起こしするような場合、やはり実行速度がストレスになる。 そんなスピード重視だが精度を落としたくない、という人におすすめなのが、OpenAIが提供するAPIを経由して、Whisper
ChatGPT,使っていますか? ChatGPTは文章を要約したり、プログラム作ってくれたり、一緒にブレストしてくれたりして本当に便利なのですが、社内情報などの独自データに関する情報については回答してくれません。 プロンプトに情報を記述して、そこに書かれている情報から回答してもらう方法もありますが、最大トークン4000の壁がありますので、限界があるかと思います。 この課題についてなんとかならないかと考えて色々と調べて見たところ、解決する方法が見つかり、いろいろと検証をして見ましたのでその結果をシェアしたいと思います。 サンプルコード(GoogleColab) 百聞は一見にしかずということで、実際に試したサンプルは以下にありますので、まずは動かしてみることをお勧めします。 このコードを上から順番に動かすと、実際にインターネット上から取得したPDFファイルに関する内容をChatGPTが回答して
受付可能なリクエストを制限していること gptのapiを叩きまくっていたら 429エラーが出てきました too many request 429はtoo many requestということで、apiを叩きすぎているのが原因らしいです もっと詳細に言えばクライアントがリクエストを投げすぎて、サーバーがそれにNoという信号を出してくる。 そのNo信号がhttpステータスコード429だということです 叩きすぎて制限を受けることをapiレート制限と言います こう言ったapiレート制限は、apiを提供してくれているサービス(openaiやtwitterなど)にはついていてそれぞれドキュメントを参照しどのようなルール内で使用可能か調べておく必要があります gpt内でのエラー理由 openaiとしてはリクエストされすぎたら、サービスが中断してしまうような負荷が生じてしまうため ユーザーごとにリクエストの
こんにちは、引越しなどの一連のゴタゴタが済んだ 2020年新卒入社予定の山口です。 今回はAzure Cognitive Service Speech to Text API(以下AST)について調査を行ったので、その結果などを報告します。またGoogle Cloud Speech-to-Text API(以下GST)と比較も行ったので、それについても記述していきます。 ASTの導入 ASTの対応ファイル形式などの調査 音声ファイル文字起こしプログラムの作成 ASTとGSTの比較 1. 実行結果の比較 2. 処理速度の比較 3. 料金面での比較 まとめ ASTの導入 今回はこのリンクの説明を元に導入をしていきます。 Azure側の設定 説明リンク Azureアカウントの作成(microsoftアカウントが必要) リソースの作成 今回は以下の画像のようにアカウントを作成しました。 リソースを
一つ前の記事を公開したところ、Microsoft Flow を業務で利用している使っている友人からコメントをもらうことができ、アイデアが膨らんできたので色々試してみました。 前回の記事はこちら Microsoft Flow と SharePoint Online で自動採番機能を実装してみた 目的を持って実装するほうが学びも多いと思うので、今後は以下のようなシナリオを仮定し、Flow を使って対応できないかを考えてみます。(何かアイデアがあればやってみるので教えてほしいです!) 利用シナリオ : カスタマーサポート お客様から問い合わせメールを受信する 問い合わせメールの記載内容をもとに、Q&A サイトや自社データベースから関連する情報を取得する 取得した情報を、自動返信メールの本文に記載する 作成した自動返信メールをお客様へ返信する 上記のように、第一次受付を完了しましたというような自動
最近乗り換えたもの Twitter: 夜フクロウ => Tweetdeck ブラウザ: Firefox(Vimperator) => Vivaldi RSSリーダー: Livedoor Reader => Inoreader ただ、これらにかなり不満がある。 情報には上流がある。情報の上流は、一次情報が乱雑に転がってる未整備の荒野みたいなもので、下流はその二次情報やまとめみたいなもの。キャズム理論でいうと、一次情報に接する人がイノベーター、イノベーターを観測する人がアーリーアダプター、イノベーターまたはアーリーアダプターによる編集物を閲覧する人がマジョリティという分類になると思う。 自分が思う近年のインターネットの問題は、一次情報を整理していたイノベーターやアーリーアダプターに対するサービスが本格的に終わってきたこと。 最初に挙げた3つのサービスは、どれもサービス終了やサポート終了などの必
この記事は Python その2 Advent Calendar 2018 - Qiita の1日目です。 responderとは GitHub - kennethreitz/responder: a familiar HTTP Service Framework for Python 2018年10月に公開された イケてるPython WebFramework です。 requestsやpipenvなどの開発者である Kenneth Reitz が(おそらく)今年のHacktoberfest 2018 - DigitalOcean 用に開発したものだと思われます。 GitHubのタグを見ると(Topic: hacktoberfest2018 · GitHub )、hacktoberfestで2位 今年10月に公開されたのに関わらず既にStarが2000以上付いており、かなり勢いがあります
APIの新規作成 MyData画面からNewと書いてあるセレクトボックスを選択することで新しいAPIを作成できる。 Magicはウェブサービス版で使われている機能と同じで細かい設定をすることができない。 そこで今回はExtractorを選択してより詳しいルールのAPIを作成する。 ちなみにClassic ExtractorとAuthenticated Extractorについてはまだよく分かっていない。 APIの実装については動画やヘルプを参考にしながら行うと良い。 丸投げしているようであるが筆者もまだ分かっていないところが非常に多いため、そちらのほうが確実である。 ここで自動取得モードが適応できれば非常にラッキーである。 ちなみに筆者は確実に行うために、CSSやJSを切って、取得したい部分を2行以上ドラッグで選択というまどろっこしい手段を用いたりした。 なおスパナボタンであるadvanc
はじめに 2017/10/27 追記 本記事はAmazon API Gatewayがリリースされて間もない時期に執筆されたものです。現在、Amazon API GatewayではCORSを有効にする設定が追加されています。CORSを有効にするには、対象のリソースの「Actions」ドロップダウンメニューから「Enable CORS」を選び、設定を行う必要があります。CORSを設定する際には公式の手順と照らし合わせながらお読みいただけますようお願いいたします。 http://docs.aws.amazon.com/ja_jp/apigateway/latest/developerguide/how-to-cors.html CORS (Cross-Origin Resource Sharing)とは、ブラウザがオリジン(HTMLを読み込んだサーバのこと)以外のサーバからデータを取得することで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く