並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 270件

新着順 人気順

解析の検索結果81 - 120 件 / 270件

  • 誹謗中傷対策として炎上時のリプライ可視化システムを作ってみた|tori

    社会問題としての炎上・誹謗中傷最近テラスハウスという番組の出演者が亡くなるという痛ましい事件がありました.この番組自体はあまりよく知らないのですが,とにかくネット上での誹謗中傷がひどかったとのことです. 事件の詳細や炎上にどう対処すべきかという話については,こちらが良くまとまっているのではないかと思いますので,詳細は省きます. 木村花さんにはご冥福をお祈りする以外ないわけですが,このような痛ましい事件が起きている一方で,その実態というのはあまりよくわかっていません.私も炎上の分析をやっていたりもしますが,基本的には数百万人規模の炎上を対象としています. というのも,個人が攻撃されている炎上というのはなかなか分析が難しいんですね.規模が小さいと他人からはどうしても見えにくいのです.だからといって,本人にとってそれはどうでもいいことかというとそんなことはないわけで,何とかしなければいけない対象

      誹謗中傷対策として炎上時のリプライ可視化システムを作ってみた|tori
    • Rustを使ってスケーラブルなプログラムを書く方法 - かとじゅんの技術日誌

      この記事はRust Advent Calendar 2021の12/24日の記事です。 仕事ではScalaを使っていますが、趣味のプログラミングではRustで書いたものが増えました。Rustは楽しいですね。 今回は、Rustでオブジェクト指向プログラミングに関数型デザインを導入することで、スケーラブルなプログラムを書く方法(スケーラブル・プログラミング)について書きます。 「スケーラブル・プログラミング」といえばScalaです。Scalaの「スケーラブル」という言葉には「小さいプログラムも大規模なプログラムも同じ概念で記述できるべきである」という、柔軟性や拡張性を重視した設計の意図が込められています。それを実現するために必要なものは、オブジェクト指向と関数型を組み合わせたマルチパラダイムな設計です。 Scalaはマルチパラダイム言語の先駆者(今も先頭を走り続けています)ですが、他の言語にも

        Rustを使ってスケーラブルなプログラムを書く方法 - かとじゅんの技術日誌
      • A/Bテスト概論 / Introduction of ABTesting

        2021年度・2022年度 リクルート エンジニアコース新人研修の講義資料です

          A/Bテスト概論 / Introduction of ABTesting
        • Kaggleで銅・銀・金メダルを取るプロセス|カレーちゃん

          Kaggleで銅メダル、銀メダル、金メダルを取るプロセスの違いや、具体的に何をすべきかについて質問がありました。 Twitterで回答を募集したところ、次の回答をもらいました。 過去に似たコンペ2,3コンペ漁って1~10位までの解法に目を通しつつ、現コンペのディスカッションを全部追って効くものを試すと銀メダルは取れるという肌感覚 https://t.co/si4GwbM4wD — 杏仁まぜそば (@an_nindouph) November 17, 2023 自分もこれと同じ感覚です。以下、少し説明します。 銀メダルを取るために必要なもの 銀メダルを獲得するために必要だと思ったのが、次の3つです。 最低限のデータ分析コンペの実力 データ分析について、最低限のみんなが知っていることを知っておくことが必要と言えます。「Kaggleで勝つデータ分析の技術」の知識があれば、十分に戦えると思います。

            Kaggleで銅・銀・金メダルを取るプロセス|カレーちゃん
          • 【QGIS】GISソフトでGoogle Earth Engineを操作する【衛星データ解析】 - LabCode

            QGISとは? QGISは、地理情報システム(GIS)のためのオープンソースソフトウェアで、地理データの閲覧、編集、分析を行うことができます。QGISは多くのプラットフォーム(Windows、MacOS、Linux)に対応しており、商用GISソフトウェアと比較しても多機能でありながら無料で利用することができます。 主な特徴としては以下があげられます。 多機能かつ柔軟性が高い: QGISは、地理データのインポート・エクスポート、地図作成、空間解析など、多くのGISタスクを実行することができます。 オープンソース: ソースコードが公開されているため、コミュニティの支援を受けつつ進化しています。また、カスタマイズや拡張が容易です。 豊富なプラグイン: サードパーティによって開発されたプラグインが多数あり、特定の機能を追加することができます。 GEEプラグインについて 今回紹介するGEEプラグイン

              【QGIS】GISソフトでGoogle Earth Engineを操作する【衛星データ解析】 - LabCode
            • リプライユーザ可視化システム

              リプライユーザ可視化システムは,多数のメンションを送ってくるアカウントが どのようなアカウントなのかを可視化するアプリです. バズった時や炎上したときに誹謗中傷のツイッターを見ると,つい,社会全体が敵に回ったように見えるかもしれません. しかし,炎上に加担する人は全体の1.5%であるという話もあることからわかる通り, たくさんの人に攻撃を受けているように見えても, その実態は数十人から数百人程度です. また,そのうちの多くがせいぜい1回か2回しかリプライを送って来ておらず, 実際にはそれほどあなたには興味を持っていない人たちと言えるでしょう. それ以外の人たちは炎上やバズりに興味すら持っていない可能性が高いのです. しかも,炎上に加担する人たちは少し通常とは異なる性質を持っているともいわれています. たくさんに見える誹謗中傷が実は全体から見れば ごくわずかな人々の手によるものだ,といいうこ

              • ドキュメントファイルの解析と変換に特化したオープンソースツール「docling」を試してみた | DevelopersIO

                AWS事業本部コンサルティング部の石川です。最近、文書ファイルの解析と変換に特化した オープンソースツール「docling」 が注目を集めています。このツールは、最先端のAIモデルを活用して、ドキュメントの構造を理解し、様々な形式に変換することができます。今回、実際にdoclingを使用して日本語のドキュメントファイルからMarkdownファイルとJSONファイルへ変換を試してみます。 doclingとは doclingは、ドキュメントの変換と解析に特化したオープンソースのPythonパッケージです。最先端の人工知能モデルを活用し、レイアウト解析にDocLayNetモデル、表構造認識にTableFormerモデルを使用しています。一般的なハードウェアで効率的に動作し、少ないリソースで高性能を発揮します。JSONやMarkdown形式への変換が可能で、拡張性も高く、新機能やモデルの追加が容易

                  ドキュメントファイルの解析と変換に特化したオープンソースツール「docling」を試してみた | DevelopersIO
                • MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog

                  こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは、MeCab互換の形態素解析器Vibrato(ヴィブラ〰ト)を開発しています。プログラミング言語Rustで実装しており、高速に動作することが主な利点です。Vibratoはオープンソースソフトウェアとして以下のレポジトリで公開しています。 github.com 本記事では、Vibratoの技術仕様を解説します。以下のような方を読者として想定します。 自然言語処理の要素技術に興味のある方 データ構造・アルゴリズムに興味のある方 Rustでの自然言語処理に興味がある方 Vibratoについて 最小コスト法による形態素解析 単語ラティスの構築 最小コスト経路の計算 高速化の取り組み 辞書引きのキャッシュ効率化 実装での注意点 連接コスト参照のキャ

                    MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog
                  • データ分析の効率が10倍上がるデータサイエンティストのためのChatGPTの活用術 - Qiita

                    ChatGPTを使ってデータサイエンティストの生産性を爆上げする活用術をまとめました! また、データサイエンティストがChatGPTを活用するための記事をまとめているので、こちらもぜひ参考にしてみてください。 データ前処理 「ChatGPTを使用すると、「データを分析可能な形に前処理して」といった大雑把なリクエストに対しても、すんなりと対応し、データ前処理を行ってくれます。」 今のところ、大量のデータを前処理する際にChatGPTを利用する場合は、ChatGPTに実際の前処理を行わせるのではなく、前処理用のサンプルコードを教えてもらう方が良いでしょう。 ただし、近い将来にはCSVやExcelを直接アップロード&ダウンロード可能な「Code Interpreter」というプラグインが追加される予定とのことで、実務利用が大いに現実味を帯びると考えられます。 詳細は以下のページで紹介しています!

                      データ分析の効率が10倍上がるデータサイエンティストのためのChatGPTの活用術 - Qiita
                    • Google Analytics 4移行対策、Publickeyの場合。Simple AnalyticsとRanklet4を導入し、GA4も使うことに

                      Google Analytics 4移行対策、Publickeyの場合。Simple AnalyticsとRanklet4を導入し、GA4も使うことに Google AnalyticsはPublickeyのようなブログに限らず、個人や組織の公式サイトやECサイト、そしてWebアプリケーションなど、さまざまなWebサイトで使われているアクセス分析ツールのデファクトスタンダードといえます。 そのGoogle Analyticsが今月(2023年7月)から、大幅に機能変更が行われた新バージョン「Google Analytics 4」(以下、GA4)に移行し、これまでのGoogle Analytics(通称UA:Universal Analytics)は廃止されました。 UAも、新しくなったGA4も、無料で利用できる大変ありがたいツールであり、こうした有用なツールを無料提供しているGoogleには

                        Google Analytics 4移行対策、Publickeyの場合。Simple AnalyticsとRanklet4を導入し、GA4も使うことに
                      • 東京五輪に関係する日本語のファイル名を持つマルウェア(ワイパー)の解析 | 技術者ブログ | 三井物産セキュアディレクション株式会社

                        東京五輪に関係するファイルを装った以下のファイル名を持つマルウェアが2021年07月20日(火) 15時頃、VirusTotalにアップロードされたことを確認しました。 【至急】東京オリンピック開催に伴うサイバー攻撃等発生に関する被害報告について.exe 早速ですが、本記事では該当検体の解析結果を共有します。 該当のファイルはVirusTotalにフランスからアップロードされており、ジェネリック検出が多いもののすでに複数のアンチウイルス製品によって検知されていることを確認しています。 図1 VirusTotalにアップロードされた不審なファイル 上記のファイルのプロパティには以下の通り何も情報が付与されていません。 図2 プロパティ情報 該当ファイルはアイコンを見る限りPDFのように見えますが、アイコン偽装されており、フォルダの詳細表示で見た場合は以下のように拡張子がEXEであることがわか

                          東京五輪に関係する日本語のファイル名を持つマルウェア(ワイパー)の解析 | 技術者ブログ | 三井物産セキュアディレクション株式会社
                        • データカタログを作成してZOZOTOWNデータベース定義をまとめた話 - ZOZO TECH BLOG

                          こんにちは。ZOZOTOWN開発本部 バックエンド1ブロックの山本です。普段はZOZOTOWNのバックエンドやマイクロサービスAPIなどの開発に携わっています。 ZOZOTOWNは膨大なデータを有しており、テーブルやカラムの数も膨大です。しかし、ER図やテーブル定義に関するドキュメントは手動で更新されていたため情報遅れが生じ、信頼性が低いものとなっていました。 本記事ではその問題を解決するための取り組み、「データカタログ作成プロジェクト」について紹介します。 目次 目次 データカタログとは Dataedo dbdocs 背景・目的 課題の解決手段 内製したソフトウェアのアーキテクチャと基本機能 ER図作成UI 利用実績に基づく仮想外部キーの作成、カーディナリティの推定 リレーションシップを持っているテーブルペアの洗い出し 1:N or 1:1の推定 0以上か1以上の推定 リレーションシップ

                            データカタログを作成してZOZOTOWNデータベース定義をまとめた話 - ZOZO TECH BLOG
                          • 日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました | Amazon Web Services

                            Amazon Web Services ブログ 日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました 多くの機械学習デベロッパーの方々が、AWS 上でさまざまなアルゴリズムの開発やモデルの構築を行なっています。中でも自然言語処理を行う際には、対象言語の特性に即した形で前処理を行う必要があります。日本語の自然言語処理を実施する際には、形態素解析と呼ばれる文章の分解処理を前位処理として一般的に行います。日本語形態素解析を行うためには、日本語の語彙データが必要となりますが、このデータは通常 GB 以上のサイズに及ぶ大きなサイズとなります。またこれらを用いた計算の際にも大量の GPU および CPU を必要とするため、従来こうしたモデルを構築する際には常にストレージおよびコンピューティングのリソースの

                              日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました | Amazon Web Services
                            • 大学図書館システムを解析して自動化した話(技術メイン)

                              皆さん、こんにちは。かろっくです。 現在は情報系の大学に通っています。 さて、大学生といったら、趣味に時間を費やしてなんぼです。 自分は大学の図書館を本当に頻繁に利用しています。 見ての通り図書館のヘビーユーザなのですが、そうなってくるとやはり図書館の操作の自動化をしてしまいたいという欲求が出てきます。 というわけで、今回は大学のシステムを解析して自動化した話をしたいと思います。 ひとまず完成形 先に、実装したコードのリポジトリを掲載します。 動作例として、discord にメッセージを送信している様子を以下に示します。 現在は延長する書籍が存在していないため終了していますが、延長の必要な書籍が存在する場合は、延長を行います。 方針 大学のシステムを自動化するにあたって、単に Selenium 等のブラウザを使うのは少し癪です。出来ることならば、ブラウザ等を利用せず、HTTP リクエストか

                                大学図書館システムを解析して自動化した話(技術メイン)
                              • 機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版)|カレーちゃん

                                機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版) こんにちわ、カレーちゃんです。Kaggle GrandMasterです。 Kaggleはデータサイエンスに入門するのにとても適しています。ですが、英語の問題などがあり、入門するのが難しい。そこで、Kaggleの「入門」をこうすれば高速に完了できるというnoteを書きます。 同じタイトルの記事を、2020年8月にも書いたのですが、それから2年以上がたちました。それから、おすすめできる資料が増え、また、私が思う入門のコースもやや変わりましたので、更新をしたいと思います。 1.Kaggleに入門(はじめに取り組むと良い資料)Kaggleには、「タイタニックコンペ」という、練習用のコンペがあります。 これは、事故が起こったタイタニックの乗客のデータから、乗客の生死を予測するという、やりたいこと

                                  機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版)|カレーちゃん
                                • 企業ブログの価値を、どう計る?アクセス解析の専門家 小川卓とコンサルタント 村山佑介が「ブログ運用担当者が見るべき数字」を語る - 週刊はてなブログ

                                  ときにバズり、多くのユーザーに出会う。あるいは、普遍的な情報で、長くユーザーに読みつがれる。ときに企業は、このようなユーザーとの幸福なコミュニケーションをオウンドメディアを通じて築きます。しかし一方で、オウンドメディア運用が企業のマーケティング活動の一環である以上、「ユーザーとの出会いには、どのような意味があったのか」を可視化することが求められます。 ユーザーが自社のサービスに好感を持ってくれた。ユーザーがメディアを通じてサービスやプロダクトの利用者になってくれた。こうしたコンテンツの先にある「メディアを運用する意味」を具体化すためには、メディアにどんなユーザーが来訪し、どのような行動をとったのか、などの要素を解析することが必須です。では、企業が見るべき、「オウンドメディアが生み出す数値」とは。 はてなブログの法人向け新プラン「はてなブログBusiness」のリリースに合わせて『週刊はてな

                                    企業ブログの価値を、どう計る?アクセス解析の専門家 小川卓とコンサルタント 村山佑介が「ブログ運用担当者が見るべき数字」を語る - 週刊はてなブログ
                                  • 地理空間情報を扱う上で知っておきたいPythonライブラリ、GeoPandas入門~応用編・衛星データと組み合わせ~ | 宙畑

                                    地理空間情報を扱う上で知っておきたいPythonライブラリ、GeoPandas入門~応用編・衛星データと組み合わせ~ 地理空間情報を解析する上で有用なPythonライブラリGeoPandas。後編では、衛星データとシェープファイルを組み合わせて解析することで、テーブルデータを作成することにチャレンジします。筆ポリゴンを任意の大きさのベクターデータで切り取り、切り取ったデータを用いて、衛星データをその範囲で取得し、NDVIの推移を求めます。 前編ではシェープファイルのような地図に重ねることのできる幾何的な情報を含んだデータと、単なるテーブルデータ(ただし、そのシェープファイルと同様のデータを含む場合。例えば都道府県の名称)を重ねて、作成したデータを描画するということを学びました。 後編となる本記事では、シェープファイルと同様に幾何的なデータを含みつつ、ラスターデータとして扱われているもの(代

                                      地理空間情報を扱う上で知っておきたいPythonライブラリ、GeoPandas入門~応用編・衛星データと組み合わせ~ | 宙畑
                                    • JavaScriptで100行で作る!数式言語のインタプリタ

                                      はじめに 皆さんはプログラミング言語を作ったことがあるでしょうか? おそらく大抵の方は「ない」というのが正直なところなのではないかと思います。背景には、おそらく「プログラミング言語を作るって難しそう」という先入観があるのではと筆者は踏んでいます。 プログラミング言語とは、コンピューターに指示を与えるための特別な言語です。私たちが日常で使う言語と同じように、プログラミング言語にも文法やルールがあります。そして、この言語を理解し実行するのが「処理系」と呼ばれるプログラムです。 しかし、実はプログラミング言語の処理系(インタプリタ)を作ることは非常に簡単なことです。小さなOSを作ることに比べても、ちゃんと動くWebサービスを作ることに比べても本当に簡単です。 というわけで、この記事では「プログラミング言語」を作るための導入として「数式言語」のインタプリタを作ってみます。数式言語とは、数学の式を扱

                                        JavaScriptで100行で作る!数式言語のインタプリタ
                                      • pingcap/parser (MySQL互換) で SQL を手軽に解析 - freee Developers Hub

                                        この記事は freee Developers Advent Calendar 2021 の23日目の記事です🎄 freee の DBRE チームに所属している caterpillar です. なんだか大きなデータベースを眺める仕事をしています. 突然ですが, pingcap/parser を使って SQL を簡単に解析していきたいと思います. Go 製 の SQL Parser で, MySQL への高い互換性を謳う TiDB で利用されています. この parser の嬉しい点はこんな感じです. シンプルで使いやすい TiDB に利用されていることから, ある程度結果を信頼できる mask 済 SQL もおおよそ構文解析可能 3つ目について, mask済の SQL は select * from users where id = ? のように一部が別の文字に置き換わっているものを指しま

                                          pingcap/parser (MySQL互換) で SQL を手軽に解析 - freee Developers Hub
                                        • 日本語形態素解析器 Sudachi の語彙データ(SudachiDict)および単語ベクトル(chiVe)が AWS 上で Open Data として公開されました | Amazon Web Services

                                          Amazon Web Services ブログ 日本語形態素解析器 Sudachi の語彙データ(SudachiDict)および単語ベクトル(chiVe)が AWS 上で Open Data として公開されました 多くの機械学習デベロッパーの方々が、AWS 上でさまざまなアルゴリズムの開発やモデルの構築を行なっています。中でも自然言語処理を行う際には、対象言語の言語ごとの辞書データや単語ベクトルデータを用いることが一般的です。これらのデータは GB 以上のサイズにおよび、また計算の際にも大量の GPU および CPU を必要とするため、従来こうしたモデルを構築する際には常にストレージおよびコンピューティングのリソースの調達が問題となってきました。AWS 上で自然言語処理モデルの開発を行う際には、Amazon SageMaker を用いて学習に必要なリソースを確保することで、ALBERT の

                                            日本語形態素解析器 Sudachi の語彙データ(SudachiDict)および単語ベクトル(chiVe)が AWS 上で Open Data として公開されました | Amazon Web Services
                                          • 宮沢賢治『銀河鉄道の夜』を、法華信仰の面から解説します。

                                            中村圭志 Daydream Believer 白昼夢研究所 @seattlelubbock 『サクリファイス』のニューエイジ的部分の解析は後に回すとして、宮沢賢治『銀河鉄道』に話を進めます。こちらは日本人の作品ですが、しかし戦前の熱狂的仏教徒のメッセージは現代日本人読者には全然通じていない、という皮肉な好例です。『銀河鉄道』は法華信仰なのに読者の印象ではキリスト教です。 pic.twitter.com/aQdB2RJAIn

                                              宮沢賢治『銀河鉄道の夜』を、法華信仰の面から解説します。
                                            • 実践 時系列解析

                                              時系列データが使われる範囲は広く、医療データ、金融分析、経済予測、天気予報など、さまざまな分野で使われています。本書は時系列データを通してデータ解析手法を学んでゆくアプローチで、データのクリーニング、プロットの方法、入出力など基本的なトピックについてひととおりカバーしてから、さまざまな分野の事例を数多く取り上げ、統計的手法と機械学習手法の両方を時系列データに適用し、また人気のオープンソースツールも積極的に取り入れた手法を紹介します。プログラムにはRとPythonの両方を利用。データセットやコードはGitHubからダウンロード可能です。 はじめに 1章 時系列の概論と簡単な歴史 1.1 時系列の多様な用途の歴史 1.1.1 時系列問題としての医学 1.1.2 気象予測 1.1.3 経済成長の予測 1.1.4 天文学 1.2 時系列解析の人気に火がつく 1.3 統計的時系列解析の起源 1.4 

                                                実践 時系列解析
                                              • みんなに長く使われるダッシュボードで押さえるべき4つのポイント - Qiita

                                                Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ビジネスの重要指標をモニターするために、ダッシュボードを作ったものの、時間の経過と共に、誰にも見られなくなってしまう、といった経験はありませんか? そうなってしまう理由の1つに、そこから得られる情報がビジネスの改善に結びつかない、あるいは特定のアクションに結びつかないため、ダッシュボードの閲覧者にとってあえて見る必要がなくなってしまうことがあります。 そこで、ダッシュボードの閲覧者に役立つ効果的なダッシュボードを作成するうえで、おさえるべき4つのポイントを紹介いたします。 1. モニターすべきは遅行指標でなく先行指標です 「売上」、「閲

                                                  みんなに長く使われるダッシュボードで押さえるべき4つのポイント - Qiita
                                                • 「√-2 × √-8 = √16?」の問題について - tsujimotterのノートブック

                                                  Twitterで数学に関するこんな話が話題になっていました。 √-2×√-8計算する時に√16にしたらいけんのなんで?— 愛華 (@sakubunkake) 2020年7月9日 もう少しツイートの内容を補足してみましょう。 というのは、虚数単位 を用いて として定義されます。よって を用いて が成り立ちます。 一方、 には積に関して なる法則が成り立つはずです。 ところが、この法則を適用すると となってしまいます。 すなわち、計算方法によって結果が になったり になったり、異なってしまっています。これは何かがおかしい。一体、どこがおかしいのだ? というのが、上のツイートが問題にしている点です。 私はこのツイートを見て、これは モノドロミー の問題だ! と直感しました。これは面白そうだと。 そこで、以前書いたこの記事 tsujimotter.hatenablog.com を思い出しながら、自

                                                    「√-2 × √-8 = √16?」の問題について - tsujimotterのノートブック
                                                  • https://jp.techcrunch.com/2020/04/15/mobility-trends-reports-in-japan/

                                                      https://jp.techcrunch.com/2020/04/15/mobility-trends-reports-in-japan/
                                                    • 究極の耳コピソフト?魔法のピッチ修正ツール?それとも新手のDAW?従来の常識を覆すオーディオエディタ、Hit’n’Mix Infinity、日本上陸|DTMステーション

                                                      「何だ!こりゃ!?」という、これまでにない常識外れのすごいオーディオエディタが誕生しました。イギリス生まれのHit’n’Mix Infinityというソフトが、それ。最新バージョンはv4.5なので、すでに海外では発売されていたようですが、4月6日からそのHit’n’Mix Infinityが国内でも正式発売されたのです。そして、日本上陸キャンペーンとして通常価格が36,000円(税抜)のところ、4月6日~5月6日の間、28,800円となっています。 これが何なのか、一言ではいい表しにくいけれど、誤解を恐れずに言えば、Melodyneを進化させて機能を増やし、より汎用的に使えるようにしたオーディオエディタといったところでしょうか…?CDのトラックを解析して、各パートに分解して音程を検出するといったこともできてしまう夢いっぱいのソフト。いわゆる波形エディタやスペクトラムエディタとはまったく異な

                                                        究極の耳コピソフト?魔法のピッチ修正ツール?それとも新手のDAW?従来の常識を覆すオーディオエディタ、Hit’n’Mix Infinity、日本上陸|DTMステーション
                                                      • 統計表における機械判読可能なデータ作成に関する表記方法案

                                                        • 新しい静的コード解析ツール「Ruff」をご紹介 | gihyo.jp

                                                          福田(@JunyaFff)です。今月の「Python Monthly Topics」は、最近私が個人的に気になっている静的コード解析ツールRuffについて紹介します。 どんなプログラミング言語でも、静的コード解析ツール(リンター)やフォーマッターは非常に便利です。Pythonでコードを書く場合、皆さんはどんなツールを使っているでしょうか?Flake8やBlack、isortなどが人気で、世界中で多くのPythonエンジニアに利用されています。 Ruffは2022年8月にリリースされた比較的新しい、Pythonのリンター兼フォーマッターです。Ruffはリリースからまだ半年足らずしか経っておりませんが、多くの著名なライブラリで採用[1]され、毎日のようにアップデートされています。2023年3月時点でのRuffの使い方、そしてこれからの発展について、本記事で紹介します。 Ruffとは? ここでは

                                                            新しい静的コード解析ツール「Ruff」をご紹介 | gihyo.jp
                                                          • データ解析や数学の理解にはイメージが大切|Dr. Kano

                                                            多変量解析であれ,機械学習であれ,データを解析する道具は数学で鍛えられている.数学というと,数式を見ると蕁麻疹がでるとか,生理的に無理とか,「日常生活で使うことはないから勉強するのは無駄(キリッ」とか,色々な感想があるだろうが,理解するために大切なのは,イメージを持つことだ. 例えば,線形代数や微積分.大学に入学すると,必修科目に指定されていれば,とりあえず履修する.δ-εがどうとか語る教員に,頼むから日本語で話してくれと思う学生もいるだろう.私もそうだった.数学の講義で,勉強したことが何に使えるのかを教える先生はいなかった.だから,数学の重要性なんてわからなかったし,興味も持たなかったし,深く理解することもなかった.もちろん,自分の研究としてデータ解析の応用に取り組むようになり,必死で数学の勉強をしなおすはめになることも想像していなかった.それくらい頭が空っぽだったわけだ. そんな昔と違

                                                              データ解析や数学の理解にはイメージが大切|Dr. Kano
                                                            • 「2024年も始まったしそろそろマルウェアの勉強を始めるか」と思っている人向けのマルウェア解析ツール入門話 - 切られたしっぽ

                                                              追記と修正 2024/01/09: FOR710 についてはプロ視点で賛否両論あったので表現を変えました 2024/01/09: FLARE-VM の構築部分でも書きましたが、解析環境と普段生活する環境は分離しましょう。VMWare or VirtualBox を使ってください。普段使いの環境にここで述べた解析ツールをいきなりインストールするとAnti-Virusに検知される可能性もあります。 TL;DR 将来的にベンダーレポートやカンファレンス発表レベルでの"マルウェア解析"を想定した話です とりあえず FLARE-VM 環境を作ってインストールされたツールを見る・触るところから始めるといいんじゃないでしょうか TL;DR はじめに "マルウェア解析" のスコープと前提知識の明確化 ツールの選択元(プール) : FLARE-VM FLARE-VM に入っている中でもよく使うツール PES

                                                                「2024年も始まったしそろそろマルウェアの勉強を始めるか」と思っている人向けのマルウェア解析ツール入門話 - 切られたしっぽ
                                                              • CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfinetune検証 - ACES エンジニアブログ

                                                                こんにちは、ACESでアルゴリズムエンジニアとして働いている檜口です。最近はChatGPTを始めとする言語モデルの研究開発やプロダクト改善に取り組んでいます。 昨年末のChatGPTのリリース以降、大規模言語モデル(large language model, LLM)の社会実装が急速に進んできています。弊社でも商談解析AIツールACES MeetにLLMを組み込むなど、LLMの活用を広げています。こちらに関してはLLMを活用したAIまとめ機能リリースの裏側について過去記事を書いてありますのでご興味ある方はぜひご覧ください。 tech.acesinc.co.jp LLMはOpenAIのChatGPTが最も有名ですが、最近はオープンソースでモデルを開発する流れも活発になっています。特に、英語で学習したオープンソースモデルはMeta社のリリースしたLlamaを始めとして非常に強力なものがリリース

                                                                  CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfinetune検証 - ACES エンジニアブログ
                                                                • デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場

                                                                  3つの要点 ✔️ デコンパイルに特化した初のオープンソースモデル「LLM4Decompile」を開発 ✔️ モデルに新しい学習目的を導入し、デコンパイルの精度向上を実現 ✔️ 再コンパイルと再実行可能性に焦点を当てたデコンパイルのための初の標準化されたベンチマークを構築 LLM4Decompile: Decompiling Binary Code with Large Language Models written by Hanzhuo Tan, Qi Luo, Jing Li, Yuqun Zhang (Submitted on 8 Mar 2024) Comments: Published on arxiv. Subjects: Programming Languages (cs.PL); Computation and Language (cs.CL) code: 本記事で使用してい

                                                                    デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場
                                                                  • ごちきか

                                                                    ごちきか# NTTコミュニケーションズ イノベーションセンターでは、社会・産業DXのためのSmart World の一環として、時系列データ分析手法の研究開発、お客さまのデータ分析支援や社内データ分析人材育成を行っています。 ごちきか(gochikika) は、これら研究開発成果やデータ分析人材育成コンテンツをまとめたナレッジベースです。大別してメインコンテンツは以下の通りです。 分析: 主に製造業の時系列データを対象として、前処理からモデリングまで一連の基本的な分析手法をPythonコード付きで解説しています。 特集記事: 比較的新しめであったり難易度の高い手法や、私たちの取り組みを知ってもらうための学会発表資料が掲載されます。また一部未分類なコンテンツが格納されています。 私たちの研究開発成果は、同じくイノベーションセンターで開発しているノーコードAI開発ツールNode-AI に搭載さ

                                                                      ごちきか
                                                                    • メソッド上にコードの複雑さを表示するVisual Studio拡張機能を作りました - Qiita

                                                                      ソースコードの複雑さ、不具合のリスクを定量化したコードメトリクス1というものがあります。 コードメトリクスは計算方法によっていくつか種類があり、メジャーなものだと以下のものがあります。 Cyclomatic Complexity(循環的複雑度) Cognitive Complexity(認知的複雑度) Maintainability Index(保守容易性指数) Lines of Code(コードの行数) これらのコードメトリクスを計算し、CodeLensに表示するVisual Studio拡張機能2を作成しました。 tackme31/howmessy: How messy is your code? 以下のようにコードメトリクスをもとにコードが複雑かどうかを判定し、CodeLensに表示してくれます(デフォルトではCognitive Complexityをもとに計算します)。 今のところ

                                                                        メソッド上にコードの複雑さを表示するVisual Studio拡張機能を作りました - Qiita
                                                                      • 理研、スパコン富岳で不織布や手作りマスクの飛沫の差を解析 ~オフィス内、イベントホールなどでのエアロゾル感染もシミュレーション

                                                                          理研、スパコン富岳で不織布や手作りマスクの飛沫の差を解析 ~オフィス内、イベントホールなどでのエアロゾル感染もシミュレーション
                                                                        • 他人にデータを渡さずに無料でアクセス解析できるオープンソースツール「umami」

                                                                          ウェブサイトのアクセス解析にはGoogle Analyticsがよく利用されますが、サイトの訪問者についての情報をGoogleに教えたくないという人もいるはず。「umami」は、Google Analyticsの代わりとして利用できる無料のオープンソースアクセス解析ツールです。 umami https://umami.is/ umamiの利用は無料ですが、自分でサーバーを立てて運用する必要があります。インストール手順を解説したページによると、インストールからアプリの起動までは数個のコマンドを実行するだけでOKとのこと。なお、データベースサービスとしてMySQLかPostgreSQLのどちらかが必要です。 インストールが完了したらブラウザからサーバーにアクセスしてログインします。初期ユーザーネームは「admin」、初期パスワードは「umami」に設定されています。 「Setting」の「We

                                                                            他人にデータを渡さずに無料でアクセス解析できるオープンソースツール「umami」
                                                                          • スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita

                                                                            手っ取り早く、やられたシーンを抽出したい人向け OBSと連携するWebアプリを作成しました 詳細はこちらの記事をご参照ください。 スプラトゥーン3で、やられたシーンをOBSのリプレイバッファで自動保存する 以前のWebアプリ スプラトゥーン2 やられたシーン自動頭出しツール「iKut」 Dockerイメージ こちらでDockerイメージを配布しています。 はじめに スプラトゥーン2を発売日からやりこんで3年になります。2年かけて全ルールがウデマエXに到達しましたが、そこからXパワーが上がらずウデマエX最底辺で停滞しています。最近は自分のプレイ動画を見て対策を立てるのですが、すべての動画を見るのは大変です。そこで敵にやられたシーンは特に修正すべき自分の弱点があると考え、そこだけを自動で抽出するシステムを作ってみました。 ↑このシーンを切り出します。 画像の引用 この記事では任天堂株式会社のゲ

                                                                              スプラトゥーン2のプレイ動画から、やられたシーンだけをディープラーニングで自動抽出する - Qiita
                                                                            • Wiresharkでできないことができる、パケット解析×プログラミング

                                                                              新型コロナウイルス禍で企業ネットワークの姿が変わってきています。ネットワーク管理にも変化に対応した手法が求められています。この特集ではネットワークを流れるパケットをキャプチャーして収集し、Pythonとリレーショナルデータベースを用いて精度よく解析するための実践的なテクニックを紹介します。第2回はパケット解析のツールとしてよく使われる「Wireshark」で「できる」こと、「できない」ことを通してパケットキャプチャーにプログラミングを導入する背景やその考え方を解説します。 パケット解析をする際によく使われる「Wireshark」をご存じでしょうか。オープンソースソフトウエア(OSS)として現在も活発に開発が続けられています。もはや業界標準と言っても差し支えないポピュラーなツールです。パケットキャプチャーの参考書などでは必ずと言っていいほど取り上げられており、Wiresharkの使い方がパケ

                                                                                Wiresharkでできないことができる、パケット解析×プログラミング
                                                                              • 自宅のPCで新型コロナウイルス治療に向けた解析が可能に

                                                                                  自宅のPCで新型コロナウイルス治療に向けた解析が可能に
                                                                                • Google データポータル作成例:弊社(HAPPY ANALYTICS)の場合 - Real Analytics (リアルアナリティクス)

                                                                                  HAPPY ANALYTICSではGoogleデータポータルを利用して、自社の状況をモニタリングしています。どういったデータポータルを作成しているのか?全12ページの内容を紹介&解説しますね。 参考になるかは分かりませんが、こんな感じの数値見ているのか、くらいの気持ちでご覧いただければ! ページ1:月別KPI数値 ページ2:目標数値レポート(半期) ページ3:リード獲得レポート ページ4:リードから商談レポート ページ5:新規取引先責任者レポート ページ6:商談情報 ページ7:コーポレート集客 ページ8:コーポレート広告 ページ9:コーポレートサイト内 ページ10:Twitter ページ11:Facebook ページ12:ブログ ページ1:月別KPI数値 メインのスライド。弊社ではファネルとして 弱リーチ⇒強リーチ⇒有効人数⇒商談数⇒売上 を設定しており、その数値がまず記載されています。

                                                                                    Google データポータル作成例:弊社(HAPPY ANALYTICS)の場合 - Real Analytics (リアルアナリティクス)

                                                                                  新着記事