LayerX エンジニアブログ

LayerX の エンジニアブログです。

LLMを活用した機械学習モデルのアノテーション効率化

機械学習エンジニアの吉田です。今回は、LLM (Large Language Models) を活用して、機械学習モデルに必要なデータのアノテーション作業を効率化する取り組みについて紹介します。 なお、アノテーションにおけるLLMの利用に関しては、クラウドベンダー各社及…

TensorRTとTriton Inference Serverで推論サーバの性能を劇的に改善し本番導入した話

機械学習エンジニアの吉田です。前回は NVIDIA Triton Inference Server の性能を検証した話を書きましたが今回はその続編となります。 tech.layerx.co.jp 前回の記事以降も継続してTriton Inference Serverの検証を重ねた結果、推論サーバの性能を大幅に改…

NVIDIA Triton Inference Server の性能検証

機械学習エンジニアの吉田です。今回は機械学習モデルの推論サーバとして NVIDIA Triton Inference Server の性能を検証した話です。 (追記) 続編も書きました tech.layerx.co.jp 背景 バクラクでは請求書OCRをはじめとした機械学習モデルを開発していますが…

【DEIM2024参加レポート】LayerXにおける機械学習技術の活用事例に関する発表内容やセッションの紹介など

機械学習エンジニアの吉田です。 この記事は DEIM2024 (第16回データ工学と情報マネジメントに関するフォーラム) の参加レポートとなります。LayerXは昨年に引き続きプラチナスポンサーとして協賛させていただきました。 tech.layerx.co.jp 今年は 2月28日(…

バクラクの帳票画像を用いたDALL-E dVAEの学習

機械学習エンジニアの吉田です。 この記事はLayerXテックアドカレ14日目の記事です。前回は @shnjtk による ストーリーポイントではなくアウトカムで開発速度を測る でした。次回は osuke さんが担当します。 今回はバクラクの帳票画像を使ってDALL-EのdVAE …

バクラクのデータセットを用いたLayoutLMv3による事前学習

機械学習エンジニアの吉田です。本記事では、LayoutLMv3*1というモデルをバクラクで取り扱っている帳票で事前学習を行い、それをファインチューニングして項目推定タスクに取り組んでいる話をご紹介します。 背景 LayerXで提供しているバクラクでは帳票をア…

バクラクMLチームの技術スタックの変遷

機械学習エンジニアの吉田です。 夏ですね。7月はLayerXエンジニアブログを活発にしよう月間 です。 昨年バクラクOCRの機械学習モデルの検証から本番投入までの取り組みについて記事を書きました。 tech.layerx.co.jp その後、運用する中で新たな課題が生ま…

【JSAI2023参加レポート】バクラクOCRの取り組みに関する発表内容やセッションの紹介など

機械学習エンジニアの吉田です。 この記事は2023年6月6日(火) ~ 6月9日(金)に熊本で開催されたJSAI2023 (第37回 人工知能学会全国大会) の参加レポートとなります。 LayerXとして今年はDEIM、NLPに続く3回目の学会参加となりました。 今回JSAIに初めてプラチ…

バクラクOCRにおける機械学習モデルの検証から本番投入までの取り組み

機械学習エンジニアの吉田です。今年の3月にLayerXに入社し主に機械学習を活用したOCRの開発をしています。それまでルールベースで実装されていた工程を一部機械学習ベースの実装に置き換えつつあり実際に本番でも稼働しています。この記事ではどのように検…