keijakのブックマーク (1,311)

  • OpenAI o3は,人間とは全く異質の汎用知能である危険性【東大解説】|神楽坂やちま(やっちん)

    OpenAI o3は,人間とは全く異質の汎用知能である恐れがある. 競技プログラミングCodeforcesで,人類に混じってo3が全世界175位となったのはすさまじい. ガチの数学者たちが全力で作ったベンチマークFrontierMathで,o1-previewでも2%しか正解しなかったところが,o3では25%も正解してしまった. しかし,一番の問題はそこではない. 全く別次元のところにある. ARC-AGIというベンチマークだ. o1で25%だったところを,o3で75.7%と大幅に更新したが,これはただ点数が上がったという話では終わらないのだ. ARC-AGIの公式アナウンスやその他様々な情報源を元に,以前からARC-AGI領域をモニタリングしていた東大在籍の研究者の卵が解説する. ARC-AGIとは大雑把に言うと,人間には簡単だが,従来のAIが無理矢理解くことはほぼ不可能なベンチマークで

    OpenAI o3は,人間とは全く異質の汎用知能である危険性【東大解説】|神楽坂やちま(やっちん)
    keijak
    keijak 2024/12/23
  • 40代にやっておいてよかったこと - 勘と経験と読経

    50代のおっさんエンジニアになってたので、雑に40代にやっておいてよかったことなどを振り返ってみた。思い出補正があるかもしれないので参考にしようとする人は注意。 運動習慣をつけた 資格学習を継続した 読書習慣を維持した 仕事と関係ない勉強を始めた IT勉強会コミュニティへの参加をやめた ブログを書き続けた 運動習慣をつけた 40歳になったころに人間ドックでメタボ判定を1度受けたことをきっかけに、運動をするようになった。現在も続けているので習慣化に成功しており、おおむね健康を維持できている。 ゴルフを含めてスポーツの趣味はない(今もない)。ゴルフは誘われるけど、興味がない(週末に会社の人と遊ぶような思考を持ち合わせていない) ダイエットするなら事改善というのは理解しているけど難しそうなので、筋肉つけて代謝を高める方向性を選択 コロナ禍以前は会社帰りに福利厚生で安く使えるジムのプールで泳いで

    40代にやっておいてよかったこと - 勘と経験と読経
    keijak
    keijak 2024/12/23
  • Ruff はなぜ速いのか? | Wantedly Engineer Blog

    こんにちは。ウォンテッドリーでデータサイエンティストとして働いている市村(@chimuichimu1)です。この記事は Wantedly Advent Calendar 2024 の22日目の記事です。 私は普段業務で推薦システムの開発に携わっており、プロダクトを継続的かつ効率的に改善していくため、コードの内部品質が重要だと感じています。内部品質が保たれていないコードベースでは、機能追加や改善のスピードが落ちるだけでなく、バグの温床にもなります。 こうした内部品質を担保する1つの手段として、静的解析ツールの利用が考えられます。この記事では近年注目されている Python の静的解析ツールの Ruff について紹介したうえで、特にその高速性に焦点を当て、それがどう実現されているかについて深堀りしたいと思います。 目次Ruff とは Ruff が高速に動作する理由 並列性 冗長性の排除 整数値

    Ruff はなぜ速いのか? | Wantedly Engineer Blog
    keijak
    keijak 2024/12/23
  • 時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい

    この記事は Qiita に投稿した以下の記事と同一の内容です。 https://qiita.com/s_katagiri/items/7f06ca85f851e0a50516 概要 時系列データ、あるいは独立かつ同一の分布 (i.i.d.) の仮定が成立しない、観測点どうしで自己相関のあるデータに対する予測モデルの交差検証(クロスバリデーション)について書きます。情報量規準との関連まで書きたかったけど時間がないので時系列データとクロスバリデーションについてだけ書きます。 文ではまず、最初のセクション1では交差検証がなんであるかを確認したうえで、時系列データは交差検証法の想定しているものではなく、そのまま使うことが難しいことを直感的に説明します。次のセクション2では、これまで提案された様々な時系列データに対する予測誤差の評価方法を紹介します。セクション3では、これらの性能を実験で検証した研

    時系列データの交差検証(クロスバリデーション)は交差検証とはいえないし、良い方法でもないらしい
    keijak
    keijak 2024/12/20
  • Haskeller の異常な愛情:または、生粋の Haskeller は転職して Rust を一ヶ月半書いて何を思うようになったか

    Haskeller の異常な愛情:または、生粋の Haskeller は転職して Rust を一ヶ月半書いて何を思うようになったか この記事は Jij Advent Calendar 2024、Haskell Advent Calendar 2024、およびRust Advent Calendar 2024シリーズ2 の18日目の記事です。 各カレンダーの前後の記事は以下の通りです: Haskell Advent Calendar 2024 前の記事: 次の記事: gotoki_no_joe さんの「集めるDPについて」 Rust Advent Calendar 2024 シリーズ2 前の記事:yasuo-ozu さんの「物のSpecializationをStable Rustで!」 次の記事:hyumanase さんの「Rust.Tokyo 2024 に初参加した」 Jij Adven

    Haskeller の異常な愛情:または、生粋の Haskeller は転職して Rust を一ヶ月半書いて何を思うようになったか
    keijak
    keijak 2024/12/19
  • 日本に拠点を置くAI企業「Sakana AI」がキャッシュメモリの使用量を最大75%削減する技術「NAMM」を開発

    Sakana AIが「進化したユニバーサルトランスフォーマーメモリ」という論文を発表しました。論文によると、ニューラルアテンションメモリーモデル(NAMM)という新たな仕組みを導入することでコンテキストにおいて冗長な情報を削減でき、推論時のメモリ効率を高めることができたとのことです。 An Evolved Universal Transformer Memory https://sakana.ai/namm/ [2410.13166] An Evolved Universal Transformer Memory https://arxiv.org/abs/2410.13166 AI体である大規模言語モデル(LLM)では、ユーザーからの入力であるプロンプトをコンテキストとして受け取り、新たな返答を生成しています。現在主流のモデルは数十万から数百万トークンという非常に長いコンテキストを受

    日本に拠点を置くAI企業「Sakana AI」がキャッシュメモリの使用量を最大75%削減する技術「NAMM」を開発
    keijak
    keijak 2024/12/19
  • ギバーに産まれて・テイカーに産まれて - kyogoku’s blog

    ギバーとは共に産む考え方の人、テイカーとは取引の考え方の人である、という言説が流れてきた。それがギバーとテイカーの正しい定義なのかは疑わしい(そもそも正しい定義なんてものがあるぐらい厳密な言葉だったっけ?)が、個人的には、この分け方は実感を持って同意できるなあと感じたので、少し語ろうと思う。 *** まずは定義への理解促進から。この定義において「テイカーはギバーから奪うことはできない。テイカーはより弱いテイカーから奪うことしかできない。」「そもそもテイカーはギバーを忌み嫌い、避ける。」という説明がされていたけど、想像つかない人には、まずこの点からして「どうして???」となるだろうなと思ったので解説したい。 これを理解するには、いわゆる「かなり田舎の密な集落」を想像するといいと思う。彼らは優しく、あなたに野菜をくれるであろう。だが、それを受け取るということは、あなたはそこの一員になることに同

    ギバーに産まれて・テイカーに産まれて - kyogoku’s blog
    keijak
    keijak 2024/12/18
    抹茶〜
  • 【VSCode】 マルチカーソル、使ってますか?

    マルチカーソル機能の使い時 筆者がマルチカーソルを使用したくなる場面を3つ紹介します。 1. 命名を一括変更するとき 変数名や関数名を一括で変更するときに、マルチカーソル機能を使うことで、短時間で変更を行うことができます。 命名を一括変更している様子 検索バーから一括変更する方法もありますが、その場合カーソルが残らないため上記GIFのように複数の命名を試行錯誤しながら変更することができません。 2. 特定の範囲に閉じた修正を行うとき 特定の範囲に閉じた修正を行うときにもマルチカーソル機能は有用です。 特定の関数に閉じた修正 こちらは検索バーから一括変更してしまうと、下のfuga()関数にも変更が適用されてしまいますが、マルチカーソル機能を使うことで意図した範囲の修正に留めることができます。 3. フォーマットを変更するとき 以下のGIFではCSVで定義されたデータをMarkdownのドキュ

    【VSCode】 マルチカーソル、使ってますか?
    keijak
    keijak 2024/12/18
  • コミュ障が10年かけて社交的になって気づいたこと

    コミュ障時代の俺1日の口数が5つあれば多い方他人と目を合わせて話せない雑談などできるはずもないお店の店員に質問できないネットのチャットでさえも話し方が分からない たぶん病気レベルで社交性に問題があったと思う。 社交的になった今の俺相手がいればなにかしら話してる他人と目を合わせて笑顔で話せるようになった会話を繋ぐ程度の雑談ができるようになった 場を盛り上げるトーク力はないお店やレストランで自然に質問できるようになったネットでチャットの会話もできるようになった とりあえず日常生活を気分良く過ごせるようになるまで成長できたと思う。 なんで社交的になろうとしたのか?特に大きな出来事はなかったんだけど年と共に 「人とまともにコミュニケーション取れないと生きててめんどくさい」 と思うようになった。 聞けば数分で済む仕事に何時間も使ったり。 お店で質問すればすぐわかることを躊躇して買うのやめたり。 コミ

    コミュ障が10年かけて社交的になって気づいたこと
    keijak
    keijak 2024/12/18
  • 納得感ある開発優先順位の付け方

    こんな経験はありませんか? 「開発メンバーになんでこれ優先度高い/低いんですか?」と聞かれるとき 「考えていた新機能以外にビジネスサイドからの要求が尽きない。ユーザー要望は待ったなしで、技術的な課題も放置できない……。どれから手をつければいい?」と思うとき はじめまして。株式会社GaudiyPdMをしている三島(@kaa_a_zu)です。今は漫画ゲームのIPごとにファンコミュニティを作ることが出来るFanlinkというサービスを作っています。 実際、私も優先順位で悩んだことが何度もあります。多くの要求やアイデアに囲まれたとき、どれを先に取り組むべきか判断するのは簡単ではありません。 今回の記事ではこの課題を打破する一つの手段として、今回はICEスコアをベースにした優先順位づけの方法を紹介したいと思います。 スコアリングによる初期整理、そしてスコア化だけでは拾いきれない部分を対話や情報共

    納得感ある開発優先順位の付け方
    keijak
    keijak 2024/12/16
  • モジュール分割単位の考え方 - io.kenor.blog

    こんにちは。Findy SREチームの大矢(@takenorio)です。この記事はFindy Advent Calendar 2024 16日目の投稿です。 はじめに 想定読者 話すこと 話さないこと モジュールの導入の契機 モジュールの分割単位 考え方 役割が明確であること 疎結合であること 再利用可能であること 具体例 考え方に沿った分割例 考え方に沿っていない分割例 HCP TerraformとPrivate Registry モジュールを使うことが難しい例 Route 53において環境に差分が多数ある場合 CloudFrontでOriginとCache Behaviorを細かく制御したい場合 おわりに はじめに Terraformでシステムを構築する中で、モジュールの分割単位に悩むことはないでしょうか。 モジュールの適切な分割はコードの再利用性を高め、保守性を向上させる重要な要素で

    モジュール分割単位の考え方 - io.kenor.blog
    keijak
    keijak 2024/12/16
  • 敢えて言おう、「非常口」のないソーシャルメディアは(Blueskyであろうと)カスであると | p2ptk[.]org

    以下の文章は、コリイ・ドクトロウの「Social media needs (dumpster) fire exits」という記事を翻訳したものである。 Pluralistic 火災を防ぐために当然あらゆる対策を講じるべきだが、どれほど対策を講じても燃え上がることはある。だからこそ非常口を設置しなければならない。それはソーシャルメディアサイトも例外ではない。 ソーシャルメディアには独特のロックイン(囲い込み)効果がある。我々はソーシャルメディアを通じて友人、家族、コミュニティのメンバー、視聴者、同志、顧客――つまり愛し、頼りにし、気にかける人々とつながっている。人々を一カ所に集めれば途方もない力が生まれる。デモを計画したり、資金を集めたり、イベントを企画したり、運動を起こしたりと、人が集まれば何かを成し遂げられるからだ。人々を引き寄せるソーシャルメディアは、さらに多くの人々を引き寄せていく。

    敢えて言おう、「非常口」のないソーシャルメディアは(Blueskyであろうと)カスであると | p2ptk[.]org
    keijak
    keijak 2024/12/16
  • 王ドロボウJINGという異常な漫画の話がしたい|ジスロマック

    最近、『王ドロボウJING』を読みました。 なんかやたらと人に勧められるので読んでみました。 この漫画……異常!!!!!!!!!!!!!!!!! どうしても誰かにこの漫画の話をしたい。 この思い、どこかに発散しなくては耐えられんッ!! というわけで、みなさん私の『王ドロボウJING』の話を黙って聞き続けるサンドバッグになってください。いや、なれ!! 『王ドロボウJING』1巻より 王ドロボウJINGドロボウの都・ブルーハワイの幽霊船『王ドロボウJING』1巻より この漫画、絵が上手すぎる。 いや、適当な美辞麗句とかでもなく、ただただ絵の上手さに圧倒される。いくらなんでも絵が上手すぎやしないか。読んでいて、ひたすら「絵が上手すぎないか?」と思わされ続ける。だからシンプルに「絵が上手すぎる」としか言えなくなった。 漫画って、「連載中に段々絵が上達していく」パターンが結構多いじゃないですか。でも

    王ドロボウJINGという異常な漫画の話がしたい|ジスロマック
    keijak
    keijak 2024/12/16
    懐かしー
  • 【フリーゲーム】文字通りの“推理小説ゲーム”『椿屋敷の亡霊』2つの視点から事件を考察し、隠された真相を暴け – もぐらゲームス

    時は昭和初期。一代で会社を築き上げた女社長で、財界でも名の知られた御影真珠子(みかげ しずこ)は、道楽の一環で探偵事務所を始めた。 しかし、やってくる依頼は不倫の調査に家出人捜し、迷いネコの捜索といったものがほとんど。それが退屈極まりないと感じた真珠子は事務所の留守番を孫の御影吹郎(みかげ ふくろう)に任せ、自身は放浪の旅へと出てしまった。 その日も事務所には留守番を任された吹郎と、助手として働く小戸森日向子(こともり ひなこ)の2人が居たが、状況はいつもと違っていた。事務所に過去、捜査終了となってしまった連続殺人事件の真相を解明してほしいとの依頼が手紙で送られてきたのだ。しかも、差出人は15年前に起きた事故ですでに亡くなっているはずの人物。 謎が謎を呼ぶこの事件に、吹郎と日向子は当時の資料などを参照しつつ、この連続殺人事件……「蛭沼家(ひるぬまけ)」と「咲鬼家(さかきけ)」の2つの名家が

    【フリーゲーム】文字通りの“推理小説ゲーム”『椿屋敷の亡霊』2つの視点から事件を考察し、隠された真相を暴け – もぐらゲームス
    keijak
    keijak 2024/12/16
  • 為替予測モデルの構築に挑戦したい人にむけての基礎知識

    こんにちは、マケデコを運営しているtomoです。 記事はマケデコAdvent Calendar 2024の記事として執筆させていただきました。 以前、以下のようなツイートをしたところ結構反応があったので、為替モデルについて興味がある人のために最初の一歩を踏み出せる記事を書いてみたいと思います。 最近、yoshisoくんが手元でとんでもない勝率を叩き出してbotter界隈を騒がしており、僕は最近は依頼を受けたときだけ為替のモデリングを手伝っていますが、最新技術(当時は新規論文のネタを片っ端からチームで為替のモデルに活用するというのを5年近くやってました)にはキャッチアップできていないので、昔話を交えて為替の話(若干妄想も入ります)をしたいと思います。 まず、為替とは何か? FXを触ったり、ニュースをみていると「ドル円」という言葉を聞いてドル円というアセットがあたかも存在しているように感じる

    為替予測モデルの構築に挑戦したい人にむけての基礎知識
    keijak
    keijak 2024/12/16
  • 5分でわかるDuckDB

    「合同勉強会 in 大都会岡山 -2024 Winter-」の発表資料です。 https://gbdaitokai.connpass.com/event/330065/

    5分でわかるDuckDB
    keijak
    keijak 2024/12/16
  • 評価駆動開発(Eval-driven development):LLMアプリケーション開発における課題とアプローチ - LayerX エンジニアブログ

    この記事は、LayerX Tech Advent Calendar 2024 の 12日目の記事です。 tech.layerx.co.jp こんにちは、LayerXのAI・LLM事業部プロダクトマネージャーの野畑(@isseinohata)です。 AI・LLM事業部では生成AIプラットフォーム「Ai Workforce」を開発しています。 getaiworkforce.com LLMを用いたアプリケーション開発には独自の特徴や課題が存在しており、Ai Workforceの開発チームも、日々様々なチャレンジに向き合っています。今回は、その中でも特にLLMの「出力の不確定さ」に起因する開発プロセスの課題を解決するための方法として、評価駆動開発というアプローチをご紹介します。 評価駆動開発を紹介する前に、LLMをアプリケーションに組み込む上での特徴や課題について、簡単にまとめてみます。 LLMを

    評価駆動開発(Eval-driven development):LLMアプリケーション開発における課題とアプローチ - LayerX エンジニアブログ
    keijak
    keijak 2024/12/15
  • 出社はいいけど通勤が無理って話|dora_e_m

    今年は出社回帰の年だったAmazonが出社を義務化した、LYがリモートワークを縮小、など、とにかく出社回帰の動きが目立つ1年でした。 フルリモートでも、人と会うのは大事私の今の会社はフルリモートで、オフィスには全社員分の座席はありません。たまに出社しても全然人がいなかつまたりするのですが、おぎじゅんさんがいると珈琲を淹れてくれたり、その珈琲のまわりに人が集まってきて、違う部署の人たちと交流するきっかけになってたりします。 テキストベースのコミュニケーションを仕組みとして整備する、All-Handsのような全体の意識を揃える場を高頻度に設ける、など、仕組みでフルリモートをワークさせることはできます。 けれども、人間のウェットな部分でのつながりってやっぱり大事です。数カ月に一回でも直接顔を突き合わせて、同じ目線で話すことでチームとしてのまとまりがでてきます。 だから、出社するのは大事だし、わり

    出社はいいけど通勤が無理って話|dora_e_m
    keijak
    keijak 2024/12/15
  • Gitブランチフロー規約 | Future Enterprise Coding Standards

    コーディング規約は、世の中のシステム開発プロジェクトのために無償で提供致します。 ただし、掲載内容および利用に際して発生した問題、それに伴う損害については、フューチャー株式会社は一切の責務を負わないものとします。 また、掲載している情報は予告なく変更することがございますので、あらかじめご了承下さい。 はじめに ​規約はGitランチ管理の標準的な運用ルールをまとめている。以下の想定で作成されているため留意すること。 GitHubGitLab の利用トランクベース開発(フィーチャーフラグ)を 採用しないライブラリではなく、アプリケーション(CLIツール、Webアプリケーションなどの)開発で利用する免責事項 ​ 有志で作成したドキュメントである フューチャーアーキテクトには多様なプロジェクトが存在し、それぞれの状況に合わせて工夫された設計開発の方針が存在する。規約はフューチャーアー

    keijak
    keijak 2024/12/15
  • Graft - Exploring PDF Parsers: A Comprehensive Guide

    keijak
    keijak 2024/12/15