BERT

BERT とは

BERT (バート) は、Google が 2018 年に発表した自然言語処理のためのモデルだ。文章を理解する際に、ある単語の前後 (左右両方向) の文脈を同時に考慮する「双方向」の仕組みを取り入れ、文の意味理解の精度を大きく向上させた。検索、文章分類、質問応答など、言葉を扱う多くのタスクで成果を上げ、その後の自然言語処理の発展の土台になった。

何が画期的だったか

従来	BERT
単語を一方向に読む	前後の文脈を双方向に考慮
文脈による意味の変化が苦手	文脈に応じた意味を捉える
タスクごとに一から学習	事前学習を多様なタスクに転用

特に「大量の文章で事前に言葉の一般的な理解を学び、それを個別のタスクに応用する」という考え方は、その後のモデル開発の主流になった。

word2vec からの進化

それ以前の word2vec などは、単語を文脈に依らない固定のベクトルで表現していた。そのため「銀行」と「土手」のように、同じ単語でも文脈で意味が変わる場合に対応しにくかった。BERT は文脈を踏まえて単語の意味を捉えるため、こうした曖昧さに強い。

位置づけと注意点

BERT は、文章を「理解・分類する」タスクに強みを持つモデルだ。一方、ChatGPT のように長い文章を「生成する」用途には、別の系統のモデルが適する。近年は大規模言語モデル (LLM) が注目を集めるが、BERT 系のモデルは、検索や分類のように特定のタスクを効率よく正確にこなす用途で、今も実用的な選択肢であり続けている。何を解きたいかに応じて、モデルを使い分ける視点が大切になる。

理解を深めるには関連書籍が参考になる。

BERT とは

何が画期的だったか

word2vec からの進化

位置づけと注意点

関連用語

自然言語処理

DeepLearning

word2vec

SageMaker

プロンプトエンジニアリング

Amazon Bedrock

関連する記事

わからない単語が出てきたら飛ばしていい

わからない単語は調べなくていい

プログラミングの本に出てくる英語がわからなくても大丈夫