"Image dans le néant" by gelinh boost.GILは凄い!開発者の頭の良さがビシビシと伝わってくる! ということで、今回はGILに関しての紹介記事を書こうと思います。 概要 あなたは画像処理のエキスパート。顧客の依頼で、8bitのRGB画像を処理するアルゴリズムを記述していたとします。ところが対象となるデバイスの仕様を調べていた際に、実はRGBA画像にも対応させなければいけないことが分かりました。面倒だと思いながら書いていた矢先、さらにBGRやABGR,さらには16や24bitにも対応したアルゴリズムを記述しなければならないことが判明しました。なんということでしょう…これらの画像すべてに対してアルゴリズムを書くなんて、とてもじゃないですがやってられない。やめてくれ!って感じです。 boostに付いてくるGILを用いることで、画像に対する操作をよりジェネリック
このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、 Tweet はじめに今から1週間前から、私のTwitterのフォロワー周辺で、Kinectの原理とその発展的使用方法についての議論が始まりました。 参考:Kinectの仕組みにまつわるつぶやき一覧 ところが、Kinectはその原理が詳細に書かれているところがWebには少なく、少し検索したくらいではなかなかわかりよいまとめ記事がなく、私も含めてみなさん憶測で議論せざるを得ないところがありました。 そこで、この記事では開発者の資料・インタビューなどをもとに、Kinectの原理についてまとめようと思います。これ
iPhoneアプリを公開する「App Store」は、世界中のユーザーに向けてアプリを提供するところが一番大きな魅力となっている。iPhoneユーザーに向け、モーションポートレートは、顔写真を3Dで動かす独自技術「3Dモーション技術」を利用したアプリを次々に開発し、常に注目を集めてきた。 これまで国内でPhotoSpeakやHourFaceなどのヒット作品を世に送り出してきたモーションポートレートだが、本格的な海外進出をねらったiPhoneアプリ「ZombieBooth: Alive in 3D photo(ゾンビブース)」と「PhotoAvatar(フォトアバター)」をリリースした。 今回は、「ZombieBooth: Alive in 3D photo」のお話しを開発チームのスタッフにうかがってみた。 ■なぜか笑える!怖いゾンビ 「ZombieBooth」は、iPhoneで撮影した顔写
荒い写真の空白を埋める数学の魔法「compressed sensing」!(動画あり)2010.03.08 23:005,581 satomi 「もっとズームしてくれ...そうそこだ...そいつの顔をもっとエンハンスしてくれないか...」と頼むと技師がカチャカチャやって容疑者Aの顔がクッキリ―というドラマでお馴染みのシーンが現実に! これを可能にしたのはスタンフォード大学エマニュエル・キャンデス(Emmanuel Candes)教授とUCLAテレンス・タオ(Terence Tao)教授が開発した「compressed sensing(CS)」という技法です。 映画のフェイクUIとは別物。このオバマの写真みたいに、低画素のざらざらなイメージ(左)も高画素のきれいなイメージ(右)に加工できるんですよ。 主に研究目的で開発されたもので、例えばMRIスキャンもデータを丸々じゃなく、少量だけスキャン
Infoseek, およびInfoseekロゴは 楽天株式会社の商標です。 これら以外のマークは、それぞれ関係各社の商標および登録商標です。 Copyright (c) Rakuten, Inc. All Rights Reserved.
前回、『写真に基づく3D空間構築手法の到達点』としてバラバラの写真から3D空間を構築する手法について取り上げた。コメントで言及された人もおられたが、MicrosoftはPhotosynthとして、同様にStructure-from-Motion (SfM)を用いて写真をつなぎ合わせ、インタラクティブにブラウズできるPhotosynthを公開している。 Photosynth Overhead View on Vimeo Photosynth + Bing Maps on Vimeo 現在、研究レベルではWeb上にアップされた不特定多数のユーザによる膨大な写真から街一つを再現するプロジェクトが推進されている。その名も"Building Rome in a Day"(ローマを一日にして成す)だ。下の動画はFlickr検索された画像から生成された3Dモデルを示している。本エントリでは、論文*1に基
Qi Pan 3rd Year PhD student supervised by Dr Tom Drummond in the Division of Information Engineering at Cambridge University Engineering Department. Also member and MCR president of Fitzwilliam College. Résumé [pdf] [html] 12/Nov/2009 - In a few months time when code porting (to new library versions) is complete, a Linux-based demo of ProFORMA should be released. This will be followed by a window
Touchless enables touch without touching by using a webcam to track color based markers. Touchless includes two parts: Touchless Demo is an open source application that anyone with a webcam can use to experience multi-touch, no geekiness required. There are 4 fun demos: Snake - where you control a snake with a marker, Defender - up to 4 player version of a pong-like game, Map - where you can rotat
はじめに 画像処理の応用の一つに、車や人物といった物体の検出があります。まだ、十分完成した技術とはいえませんが、車の場合は、車輪のような丸いものが一定の間隔で並んでいると車らしいと判断し、人物の場合は、丸みを帯びた白いものの真中付近に二つ並んで黒いものがあり、さらにその下の中央部に、横に長いものがあれば人物らしいと判断します。 特に、人物の検出は、防犯やセキュリティ管理の上で重要視され、研究が盛んです。最近、カメラの被写体の中から人物を探し、そこに自動的に焦点をあわせるカメラも出現しました。 画像の中から、上記のような特定のパターンを探し出すには、「テンプレートマッチング法」が良く用いられます。テンプレートとは型紙のことで、それを画像上で移動させながら比較して行くやり方です。ただし、単純な方法では、テンプレートに対して傾斜を持っている画像や、相似形であるが大きさが異なる画像は検出できません
オプティカル・フロー 動画のフレームに映るものが変わる原因は、カメラが移動した事、映っている物体が移動した事、又は照明が変わった事などが挙げられます。もし照明が変わらなければ、カメラと映っている物体の相対関係が変わった事が主な原因となる訳です。「モーション・フロー」とは3次元の空間でものがどういう風に動いているかを示す言葉です。モーション・フローは実世界の動きの事ですが「オプティカル・フロー」とはそのモーション・フローがどういう風に見えるかを表します。つまり、映像の場合、あるフレーム内のピクセルをどういう風に動かせば次のフレームになるかの事です。 単純なオプティカル・フロー 花火のオプティカル・フロー、色は方向を示します。(クリックで拡大) 2次元画像の場合、残念ながらオプティカル・フローは正確に計算できません。その原因は「アパチャー問題」と言います。複数の動かし方によって同じ画像がで
特徴点抽出を使ったパターンマッチングを作ってみました。 これは、10年越しの懸案事項であった、回転対応サーチ、縮小・拡大対応サーチ、 部分的な欠落画像に対するサーチなどに対応できるように考えたモノです。 COGNEX社やHALCONに少しでも近づけるようがんばります。 命題と、この問題に対する思い 命題は、比較的簡単です。「マーク」と呼ばれる画像を、別の画像の中から探し、その位置と角度を答えるというものです。 回転を考えなければ、画像差分を全パターン検索するといった「力技」で可能です。この時でも、縮小画像同士を比べて、明らかに違う場合を「脚きり」するといった方法で高速化が可能です。 でも、やりたいのは、角度やスケールに対応したサーチです。約10年前、COGNEX社のPATMAXというサーチを見てから、「いつかは、こんなプログラムを作ってみたい」と思っておりました。それほど、衝撃的なプログラ
物体認識のための局所特徴量 SIFTと最近のアプローチ http://www.vision.cs.chubu.ac.jp/SIFT/ 藤吉 弘亘 中部大学工学部情報工学科 概要 1. SIFT(Scale-Invariant Feature Transform) 2. SIFTアプローチの高精度化 - PCA-SIFT - GLOH(Gradient Location and Orientation) 3. SIFTアプローチの高速化 - SURF(Speeded Up Robust Features) 4. 学習を用いた高速化 - Randomized Trees 5. SIFTと一般物体認識(画像分類) 1. SIFT(Scale-Invariant Feature Transform) ステレオ画像 Related Work 回転・スケール変化 照明変化等に頑健 特徴点検出 スケー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く