日本語LLMの評価および分析を目的として、伝統的なタスクから現代的なタスクまでを網羅するオープン日本語LLMリーダーボードを公開しました。オープン日本語LLMリーダーボードは、LLM-jpとHugging Faceの協力により作成されました。 オープン日本語LLMリーダーボードでは、投稿されたLLMはHugging Faceの推論エンドポイントを用いて自動的に実行され、llm-jp-evalライブラリで評価されます。この評価プロセスでは、メモリ効率の良い推論を行うvLLMを利用しており、評価スコアの計算は全てmdxプラットフォーム上で行われます。 オープン日本語LLMリーダーボード: https://huggingface.co/spaces/llm-jp/open-japanese-llm-leaderboard Hugging Face ブログ記事: https://huggingfa