Gemini

Google が開発するマルチモーダル対応の生成 AI。テキスト・画像・音声などを扱える

AI生成AI
Gemini」の技術書を見る (115 冊) →

Gemini とは

Gemini (ジェミニ) は、Google が開発する生成 AI であり、その中核となる大規模言語モデルの名称でもある。テキストだけでなく画像・音声・動画など複数種類の情報を一体的に扱える「マルチモーダル」を前提に設計されている点が特徴とされる。ChatGPTClaude と並ぶ主要な対話型 AI の一つだ。

何ができるか

用途
文章作成・要約 長文の整理、ドラフト作成
画像の理解 写真の内容説明、図表の読み取り
コード支援 プログラムの生成・修正
検索との連携 Google の各サービスへの組み込み

Google 検索や Workspace など、同社の既存サービスへ統合されている点が、利用接点の広さにつながっている。

他の対話型 AI との関係

名称 開発元
Gemini Google
ChatGPT OpenAI
Claude Anthropic

いずれも大規模言語モデルを基盤とする対話型 AI で、得意分野や応答の傾向に差がある。マルチモーダル対応や検索・既存サービスとの連携は Gemini が訴求する強みだが、最適な選択は用途次第で、複数を比較・併用するのが実務的だ。

利用上の留意点

Gemini も生成 AI である以上、事実に基づかない誤り (ハルシネーション) を完全には避けられない。出力は一次情報で裏取りし、重要な判断を任せきりにしないことが前提になる。業務利用では、入力データの取り扱い方針やコスト構造が提供プランによって異なるため、機密情報の入力可否を含めた運用ルールを定めておくとよい。

活用の手がかりは関連書籍でも得られる。

この記事は役に立ちましたか?

関連用語

関連する記事