コンピュータビジョン最前線 Summer 2023(コンピュータビジョンサイゼンセンサマーニセンニジュウサン)
- 著者:
- 井尻 善久/牛久 祥孝/片岡 裕雄/藤吉 弘亘(イジリ ヨシヒサ/ウシク ヨシタカ/カタオカ ヒロカツ/フジヨシ ヒロノブ)
- 出版社:
- 共立出版
- 出版日:
- 2023年06月14日
- ISBN:
- 9784320125483
- 価格:
- ¥3,300
- 在庫:
- 1
- 判型:
- 全集・双書
書籍紹介
【最新動向サーベイ】
・イマドキノ拡散モデル:拡散モデルに関する最近の研究動向を紹介。基本技術、条件付き生成への拡張、生成の高速化について述べ、拡散モデルを学ぶうえで役立つリソースを紹介。
【論文フカヨミ】
・フカヨミ CLIP:2020 年に OpenAI の研究グループによって提案されて以降、さまざまなタスクで利用される基盤モデルとなっている CLIP についてフカヨミ。
・フカヨミマテリアル画像キャプション生成:近年の代表的な画像キャプション生成手法の概要と課題、そしてその課題を解決するために筆者らが ECCV2022 で提案した高速かつ高精度な画像キャプション生成手法“ GRIT ”について解説。
・フカヨミジェスチャー動画生成:これまでのジェスチャー動作生成手法に関する研究を分類しながら、主要技術と残された課題に触れ、その課題に取り組んだ DisCo についての論文および BEAT についての論文の 2 本をフカヨミ。
【チュートリアル】
・ニュウモン深層照度差ステレオ法:照度差ステレオ法の基本的な原理と、照度差ステレオ法の研究で現在主流となっているデータ駆動型の手法をわかりやすく解説。
その他、 4 コマ漫画「ふたり大学生」、 CV 分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「 CV イベントカレンダー」を掲載。
巻頭言 (日浦慎作)
イマドキノ拡散モデルー画像生成の世界を変えた魔法の舞台裏ー (石井雅人)
フカヨミ CLIP-おおざっぱな CLIP を目利きに育てる!- (品川政太朗)
フカヨミ画像キャプション生成ー CNN は不要? Transformer ですべて解決!- (菅沼雅徳)
フカヨミジェスチャー動作生成ー複雑かつ曖昧で不確実な対話の世界!- (岩本尚也)
ニュウモン深層照度差ステレオ法ー照明を操り形状を復元!その最新研究に迫る!- (山藤浩明)
ふたり大学生 (鉄分@Tetuboooon)
CV イベントカレンダー
この本に興味がある方におすすめ
この本に関連
関連記事
技術書がキャリアを変えた話 - 読書とキャリアの関係
技術書の読書習慣がエンジニアのキャリアに影響する 3 つの経路と、キャリア段階に応じた読書戦略を具体的に解説します。
年収を上げた 1 冊 - エンジニア 50 人に聞いたキャリアを変えた本
エンジニアのキャリアに転機をもたらした本にはどんな共通点があるのか。50 人の回答から見えてきた、キャリアを変える本の 3 つの特徴を分析します。
機械学習・AI 本ガイド - エンジニアが読むべき技術書の選び方
機械学習の基礎から実践まで学べる技術書の選び方を紹介。数学が苦手な人向けの学習ルートと、ML 本の賞味期限の見極め方を解説します。
関連用語
Amazon Bedrock
AWS のフルマネージド生成 AI サービスで、基盤モデルを API 経由で利用できる
SageMaker
AWS の機械学習プラットフォームで、モデルの構築・学習・デプロイを統合的に提供する
LLM
大量のテキストデータで学習した大規模言語モデル
OpenAPI
REST API の仕様を YAML/JSON で記述する標準フォーマットで、ドキュメント生成やコード生成に活用される
SSR/SSG
サーバーサイドレンダリングと静的サイト生成 - Web ページの生成タイミングと場所を制御するレンダリング戦略
プロンプトエンジニアリング
LLM から望ましい出力を得るためのプロンプト設計技法