[B! bigquery] [2ページ] michael-unltdのブックマーク

データ分析入門者のためのBigQuery50本ノック(実践編) - Qiita

はじめに今回がBigQuery50本ノック最後の記事になります。初級編・中級編の記事をご覧になっていない方はそちらもご参照ください。実践編では、実業務の中で他チームに依頼されるような内容だったり、自分でデータを見たいときに書きそうなクエリだったりを題材にしたいと思います。一部こじつけのような問題や、「それはBigQuery上ではやらんだろ！」という問題もある気がしますが、パズルみたいなものだと思ってお付き合いいただければと思います。実践編問題ここで使うテーブル使うテーブルは初級編・中級編で使ったものと同じです。 aiuto-public.knock2022_simple_ec.access_log_transf orm_日付整形済みアクセスログテーブル time アクセス日時 TIMESTAMP date_jst アクセス日 DATE path HTTPリクエストのパス S

michael-unltd 2024/10/28

bigquery

リンク

dbt-bigquery-monitoring: Monitoring BigQuery compute and storage with dbt

dbt-bigquery-monitoring helps you to monitor your BigQuery compute and storage assetsIntroductionI’ve been using BigQuery for eight years, and it’s been an incredible platform for working with data at scale using SQL. Running queries and creating tables for analytics and data products is remarkably easy. The advent of dbt has further simplified creating complex workflows for many data practitioner

michael-unltd 2024/10/22

リンク

音声データを BigQuery で分析可能に 🗣️

BigQuery で音声文字変換モデルのプレビュー版をご利用いただけるようになりました🥳 BigQuery 上で音声ファイルを簡単に文字変換して他の構造化データと組み合わせ、分析を行うことが可能です。（公式ブログもご確認ください！）これまで、音声データをスケーラブルかつ管理された方法で AI モデルに接続して、音声データから大規模なインサイトを得ることは困難でした。なぜなら、音声データの分析を行うためには、音声データの書き起こしのために個別の AI パイプラインを構築する必要があったからです。これらのパイプラインは BigQuery からサイロ化されており、文字変換されたデータを BigQuery に取り込むためにはカスタムインフラストラクチャを作成する必要がありました。しかし、BigQuery 上で音声文字変換モデルをご利用いただくことで、SQL のシンプルさとパワーを活用して

michael-unltd 2024/10/09

ai
bigquery

リンク

BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する

はじめにこんにちは、Google Cloud Partner Top Engineer 2024 を受賞いたしました、クラウドエースデータソリューション部の松本です。クラウドエースデータソリューション部についてクラウドエースのIT エンジニアリングを担うシステム開発統括部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータソリューション部です。弊社では、新たに仲間に加わってくださる方を募集しています。もし、ご興味があればエントリーをお待ちしております！今回は、BigQuery で Vertex AI の LLM を使用して SQL のみで RAG を構築する方法についてご紹介します。この記事はこんな人にオススメ BigQuery の SQL のみで LLM を使った問合せシステムを構築したい BigQue

michael-unltd 2024/10/09

リンク

自然言語でデータ分析ができるGemini in BigQuery(データキャンバス)を試してみた - G-gen Tech Blog

はじめまして！4月に G-gen に入社した奥田梨紗です。この度 Google Cloud Next '24 in Las Vegas で発表された Gemini in BigQuery を試してみたので手順等をご紹介します。はじめに Gemini in BigQuery とは試したこと Google Cloud 側へ利用申請を行う BigQuery キャンバスを作成 Gemini in BigQuery を用いて SQL やグラフを作成例1: 特定の数値でデータを分類する例2: 分類分け例3:グラフを作成関連記事はじめに Gemini in BigQuery とは Google Cloud Next '24 で発表された Gemini for Google Cloud の機能の1つです。データキャンバスを作成し、自然言語（いわゆる普段話す言葉）をプロンプトに入力することで

michael-unltd 2024/09/27

bigquery

リンク

Google BigQuery

michael-unltd 2024/09/08

リンク

Google Cloud Ready - BigQuery パートナー

フィードバックを送信コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。 Google Cloud Ready - BigQuery パートナー BigQuery 検証プログラムに参加すると、パートナーは BigQuery との統合を検証し、最適な統合を実現することができます。BigQuery 検証プログラムは次の 3 つのフェーズから構成されます。評価: Google のチームが、サンドボックス化された本番環境で一連のデータ統合テストを実施し、結果をベストプラクティスやパフォーマンスベンチマークと比較します。強化: 評価フェーズの結果に基づき、Google がパートナーと協力して不足部分を補います（ギャップがある場合）。実現: パートナーと協力して既存のドキュメントを改善し、共通のお客様が Google プロダクトを最適な状態で使用できるよう万全の

michael-unltd 2024/09/03

“BigQuery 検証プログラムに参加すると、パートナーは BigQuery との統合を検証し、最適な統合を実現することができます。BigQuery 検証プログラムは次の 3 つのフェーズから構成されます。評価: Google のチームが、サンドボッ

bigquery

リンク

Google広告データをBigQueryに直接エクスポートする方法(BigQuery Data Transfer Service利用)

GA4のBigQueryデータセットはどのリージョンに配置するべきか？2024年05月19日; Web解析

michael-unltd 2024/09/02

リンク

[GA4]iOS14.5以降のIDFAの取得状況の確認 | アユダンテ株式会社

Googleアナリティクス（以降、GA4と呼びます）とアプリのGoogle広告キャンペーンを連携する際に利用されるIDは広告識別子advertising_id（Androidでは広告IDと呼び、iOSではIDFAと呼ばれる）の情報が使われております。2021年3月にリリースされたiOS14.5（iPadOS14.5、tvOS14.5)によって、iOSの広告識別子情報の取得状況を確認をしてみましょう。サービスによってユーザーに追跡を許可されている割合は変わってきます。GA4で考え抜かれたリマーケティング用オーディエンスを作ったとしてもアプリのGoogle広告へ連携できるのは、アクティビティの追跡を許可された端末を持っているユーザだけになります。GA4のオーディエンスのボリュームが100,000件あったとして、追跡許可率が20%であれば、20,000件のリマーケティングリストと変わりません。

michael-unltd 2024/08/27

GA4
bigquery

リンク

BigQueryの導入理由から新機能Analytics Hubによるコスト削減まで。プレイドのCore Platformチームが活用法を解説する - Findy Tools

公開日 2024/08/26更新日 2024/08/26BigQueryの導入理由から新機能Analytics Hubによるコスト削減まで。プレイドのCore Platformチームが活用法を解説するはじめに株式会社プレイドのCore Platformチームに所属しているBrownです。このたびはプレイドでコアに使用しているBigQueryについて、なぜBigQueryをコアのアーキテクチャに置いているのかから、BigQueryの新しい機能であるAnalytics Hubを用いたストレージや管理コストの削減に関して記事を寄稿させていただきます。本記事では、BigQueryを使う際に、近年よく耳にするようになった「データのサイロ化」をデータ分析の具体例として取り上げ、そのようなデータに対してどうやってBigQueryを活用するのかについて紹介します。このブログの想定する読者の方データ

michael-unltd 2024/08/26

bigquery

リンク

Analytics Hub で加速するデータシェアリング

本記事は Google Cloud Japan Advent Calendar 2022 の通常版 22 日目の記事です。皆様、いかがお過ごしでしょうか？ Google Cloud パートナーエンジニアの山中です。本記事では Google Cloud Next'22 で一般利用（GA）としてアナウンスされました Analytics Hub を用いたデータ共有方法についてご紹介します。 Analytics Hub とは Analytics Hub は組織間でデータを効率よく安全に共有可能とする BigQuery を基盤としたデータシェアリングサービスです。データを共有することに主眼をおいたサービスとなっており、例えばグループ会社間でのデータ共有やオープンデータの公開などのユースケースに適用できます。 Analytics Hubの仕組み Analytics Hub の仕組みは非常にシ

michael-unltd 2024/08/08

bigquery
CDP

リンク

自然言語でデータ分析できる「BigQuery データキャンバス」

はじめにこんにちは、クラウドエースデータソリューション部の坂田です。先日、アメリカ・ラスベガスで、年に一度の大規模イベント「Google Cloud Next'24」が開催されました。イベントの最大のテーマはやはり「生成 AI」で、生成 AI に関する様々な新しいサービスや機能が発表されました。その中でも、今回は BigQuery データキャンバスという BigQuery の新機能をご紹介します。 Next'24 の発表内容をさくっと知りたい方は ↓ をチェック読んで欲しい人 BigQuery を使ってデータ分析をしている方生成 AI × データ分析に興味がある方 BigQuery データキャンバスとは BigQuery データキャンバスとは、BigQuery データに対して、自然言語（日本語や英語）を使ってデータ分析を行うことができる機能です。主に以下のような機能

michael-unltd 2024/08/07

bigquery
BI

リンク

Braze➡︎GCS➡︎BigQueryを連携してみた | DevelopersIO

Brazeブロガーの國崎です。前回BrazeのCurrentsを使ってGoogle Cloud Storageにエクスポートするをやってみました。ひとしきり、やった自分を褒めちぎったので次はGCS➡︎BigQueryに連携して、結果Braze➡︎GCS➡︎BigQueryが出来てるよね！ってことをしようと思い、その手順を当記事では書かせていただこうと思います。前提条件 Google Cloudのプロジェクト設定は完了している Brazeの契約プランにCurrentsを入れている Braze➡︎GCSの手順まず手順としてはBrazeのCurrentsを使ってGCSに書き出すところからやるのですが、そちらについてはこちらの記事で詳細を書いてますので、今回は割愛します。 GCSへの連携が終わったら、次はBigQueryへの連携です。 GCS➡︎BigQueryの手順 BigQueryを操

michael-unltd 2024/07/24

“BrazeのCurrentsを使ってGCSに書き出すところからやる”

リンク

Analytics Hubを使ってプロジェクト間でデータのやり取りを簡単にする

はじめにこんにちは、D2C エンジニアの羽原です。社内の一部プロジェクトにおいて、Google CloudのBigQueryを使用してデータの利活用が行われています。利活用を行う中で、異なるGoogle CloudのプロジェクトにおいてBigQuery上のデータを共有するシステム要件が出たため、調査を行った結果BigQueryのサービスの一部であるAnalytics Hubが最も最適であるとともに、社内のデータ利活用において非常に有用なサービスと感じたため紹介させて頂きます。 Analytics Hubとは Analytics Hubとは主に、組織間のデータアセットを安全に交換できるデータストレージを一元管理することでコスト面で削減が図れる Publicに公開されたデータセットを登録することで。自身がもつBigQuery上のデータとかけ合わせることができるなどの特徴を持っています

michael-unltd 2024/07/18

“Subscriberは、自身のGoogle Cloud環境上のAnalytics HubでListingsを購読設定する”

GCP
bigquery

リンク

BigQuery の検索インデックスを試す

TL; DR BigQuery には、検索インデックス機能というものがありますこの機能を用いると、大容量のテーブルから文字列を抽出する際に、処理するデータ量と処理完了までの時間が大幅に削減されるかもしれません検索インデックスとはこんにちは、クラウドエースデータML ディビジョン所属の田中です。クラウドエースのデータML ディビジョンは、クラウドエースの IT エンジニアリングを担うシステム開発部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門としています。先日機会があって BigQuery の検索インデックス機能を試してみましたので、今回の記事ではこの機能の概要とその結果をご紹介します。 BigQuery の検索インデックス機能は 2022 年 10 月 27 日のリリースにて GA(Generally Available: 一般提

michael-unltd 2024/06/04

1分→15秒

リンク

検索インデックスを管理する | BigQuery | Google Cloud

フィードバックを送信コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。検索インデックスを管理する検索インデックスは、SEARCH 関数を使って極めて効率的な検索ができるよう設計されたデータ構造です。検索インデックスは、サポートされている関数と演算子を使用する一部のクエリを最適化することもできます。ちょうど書籍の最後にある索引と同様に、文字列データのいずれかの列に関する検索インデックスは補助テーブルのように機能します。つまり、一意の単語を示す 1 つの列と、その単語がデータ内のどこにあるかを示すもう 1 つの列からなるテーブルのようなものです。検索インデックスを作成する検索インデックスを作成するには、CREATE SEARCH INDEX DDL ステートメントを使用します。インデックスを作成するプリミティブデータ型を指定する方法については、検索イ

michael-unltd 2024/06/04

“SELECT table_name, index_name, ddl, coverage_percentage, analyzerFROM my_project.my_dataset.INFORMATION_SCHEMA.SEARCH_INDEXESWHERE index_status = 'ACTIVE';”

リンク

インデックス登録されたデータを検索する | BigQuery | Google Cloud

フィードバックを送信コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。インデックス登録されたデータを検索するこのページでは、BigQuery での検索の例を示します。データをインデックスに登録すると、BigQuery で SEARCH 関数や、=、IN、LIKE、STARTS_WITH などその他の関数と演算子を使用するクエリを最適化できるようになります。 SQL クエリでは、一部のデータがまだインデックスに登録されていない場合でも、取り込まれたすべてのデータから正しい結果が返されます。ただし、インデックスを使用することにより、クエリのパフォーマンスが大幅に向上します。スキャンされるデータが少ないために検索結果の数がテーブル内の合計行数に対してごく少なくなる場合に、処理されたバイト数とスロットのミリ秒数が最大限削減されます。クエリにインデックスが使用され

michael-unltd 2024/06/04

“SQL クエリでは、一部のデータがまだインデックスに登録されていない場合でも、取り込まれたすべてのデータから正しい結果が返されます。ただし、インデックスを使用することにより、クエリのパフォーマンスが大幅

リンク

BigQueryの Non-incremental Materialized viewsがプレビューになりました

はじめにこんにちは、クラウドエースデータML ディビジョン所属の中村です。クラウドエースのIT エンジニアリングを担うシステム開発部の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのがデータML ディビジョンです。データML ディビジョンでは活動の一環として、毎週Google Cloud の新規リリースを調査・発表し、データ領域のプロダクトのキャッチアップをしています。その中でも重要と考えるリリースを本ページ含め記事として公開しています。今回紹介するリリースは、BigQueryの「Non-incremental Materialized views」についてです。このリリースにより、マテリアライズドビュー作成時にOUTER JOINやUNION、HAVING等ほとんどのSQLクエリが使用できるようになりました。なお、この機能は

michael-unltd 2024/05/31

“BigQueryの「Non-incremental Materialized views」についてです。このリリースにより、マテリアライズドビュー作成時にOUTER JOINやUNION、HAVING等ほとんどのSQLクエリが使用できるようになりました。”

bigquery

リンク

BigQueryの動的SQLでシャーディングテーブルを作成する - Qiita

課題 UniversalAnalyticsのBigQueryテーブルのデータ抽出において、UNNESTの処理によって想定外に処理量が増えてしまうケースがあります。直近30日分を取得するクエリ例えば以下のようなクエリでGAテーブルから直近30日分を抽出するとします。 DECLARE FROM_DATE, TO_DATE STRING; SET FROM_DATE = CAST(FORMAT_DATE("%Y%m%d", DATE_SUB(CURRENT_DATE(), INTERVAL 30 DAY)) AS STRING); SET TO_DATE = CAST(FORMAT_DATE("%Y%m%d", DATE_SUB(CURRENT_DATE(), INTERVAL 1 DAY)) AS STRING); SELECT date, ( SELECT MAX( IF (INDEX

michael-unltd 2024/05/30

bigquery

リンク

BigQueryのシャーディングテーブルをLooker Studioで可視化する方法｜CO-WRITE

こんにちは。新米分析官のA.K.です！今回は、Looker StudioでBigQuery上にあるシャーディングテーブルを読み込んだ時のエラーとその対処方法についてご紹介します。エラーの紹介 Bigquery側でサンプル用のテーブルを用意しました。テーブルはサフィックスに「YYYYMMDD」形式で日付を持っているデータです。中には適当な値を入れています。作成に使用したクエリ例は以下の通りです。 create or replace table {dataset}.demo_{yyyymmdd} ( create_datetime DATETIME, category STRING, price INT64 ); insert into {dataset}.demo_{yyyymmdd} (create_datetime, category, price) VALUES ('2023-0

michael-unltd 2024/05/30

リンク

はてなブックマーク

タグ

関連タグで絞り込む (109)

bigqueryに関するmichael-unltdのブックマーク (328)

お知らせ

今週のはてなブックマーク数ランキング（2025年1月第4週）

【完了】はてなブックマークの計画メンテナンスのお知らせ（2025年1月31日(金) 深夜1:30〜3:00）

ブックマークしたエントリーのタイトル変更機能の提供を一時的に停止します

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス