ChatGPT ・ Gemini ではじめる 実行型 AI 開発入門
Apps inside / Computer Use による AI エージェントのワークフロ -
- 著者:
- 掌田津耶乃
- 出版社:
- ラトルズ
- 出版日:
- 2026年01月23日頃
- ISBN:
- 9784899775621
- 価格:
- ¥2,860
- 在庫:
- 1
- 判型:
- 単行本
書籍紹介
本書は、 ChatGPT や Gemini といった生成 AI が、人間の代わりにアプリや Web ブラウザを操作する「実行型 AI (AI エージェント) 」の仕組みと実践方法を、基礎から段階的に解説した一冊です。 Chapter1 では、 AI が「文章を返す存在」から「 PC を操作する存在」へと進化した背景を整理し、 Computer Use という新しい AI の役割が、私たちの仕事や開発スタイルをどのように変えるのかを概観します。 Chapter 2 では、 ChatGPT の Apps inside 機能を取り上げ、アプリの追加や基本設定、プロンプト設計など、実際に使い始めるための基礎を解説します。 Chapter 3 ・ 4 では、 Apps inside 向けのアプリを Node.js および Python で開発する方法を詳しく紹介し、 MCP サーバーの構築から Gradio を用いた UI アプリ作成まで、実践的な開発フローを学びます。 Chapter 5 では、 Google の Gemini に焦点を当て、 Python からの利用方法や、生成 AI としての特性を整理します。 Chapter6 では、 Gemini Computer Use と Playwright を組み合わせたブラウザ操作エージェントの実装を通じて、 AI が Web を自律的に操作する高度なワークフローを体験します。 対象読者 • 実行型 AI ・ AI エージェントに興味がある方 • ChatGPT / Gemini を「使う側」から「動かす側」へ進みたい方 • ブラウザ操作・業務自動化・ AI ワークフローを実装したいエンジニア Chapter 1 AI が“ PC を動かす”時代 Chapter 2 「 Apps inside 」のアプリを使いこなそう Chapter 3 Apps inside アプリの開発 Chapter 4 Python による Apps inside アプリ開発 Chapter 5 Gemini を活用する Chapter 6 Gemini Computer Use を利用する