Traffine I/O

日本語

2023-08-28

LLMのコンテキストサイズとベクトルデータベース

Vector Database

Vector Database

LLM

はじめに

大規模言語モデル（LLM）は、近年多くの注目を集めています。LLMの課題の一つにモデルが不正確な情報を生成する「ハルシネーション（hallucination）」があります。

ハルシネーションへの解決策としてコンテキストのサイズを拡大するという手法があります。コンテキストのサイズは、モデルが一度に処理できるテキストの量です。AnthropicやOpenAIなどの企業はLLMに与えることができるコンテキストの容量を拡大する方向で研究を進めています。

コンテキストの過多による弊害

コンテキストのサイズを大きくすることで、モデルはより多くの情報を一度に処理できます。理論的には、これによってモデルがより複雑な問題に対処できるようになる可能性があります。

しかし、このコンテキストのサイズを大きくすることには、次のような課題があります。

応答の品質の低下
コンテキストのサイズを拡大すると、LLMは多くの情報を処理する必要があります。しかし、この過多な情報は、モデルが関連性のある情報を抽出する能力を低下させる可能性があります。特に、モデルが非関連な情報に困惑し、不正確な答えを生成するハルシネーションのリスクが高まります。
コンピューテーションとコストの増加
コンテキストサイズの増加に伴って必要な計算量も増加します。これは、LLMのプロバイダーがトークンごとに課金する場合、クエリごとのコストが増加することを意味します。つまり、より多くのトークンを処理するためには、より多くのリソースと費用が必要となります。

ベクトルデータベースの導入

LLMにコンテキストを提供する新しいアプローチとして、ベクトルデータベースが注目されています。ベクトルデータベースを使うことで、不要な情報をフィルタリングし、関連性の高い情報だけを処理することができます。これにより、トークンごとの効率が向上し、全体としてモデルの精度と効率性が高まります。

Pineconeの記事では、関連性の高い情報のみをコンテキストに含めることで、全体の文書を処理する場合の精度を95%維持しつつ、トークン数を25%に削減することができたと報告しています。これは、運用コストを75%削減することを意味します。

参考

ベクトル類似度

Approximate Nearest Neighbors (ANN) とは

AlloyDB

Amazon Cognito

Amazon EC2

Amazon ECS

Amazon QuickSight

Amazon QuickSight

Amazon RDS

Amazon Redshift

Amazon Redshift

Amazon S3

API

Autonomous Vehicle

Autonomous Vehicle

AWS

AWS API Gateway

AWS API Gateway

AWS Chalice

AWS Control Tower

AWS Control Tower

AWS IAM

AWS Lambda

AWS VPC

BERT

BigQuery

Causal Inference

Causal Inference

ChatGPT

Chrome Extension

Chrome Extension

CircleCI

Classification

Cloud Functions

Cloud Functions

Cloud IAM

Cloud Run

Cloud Storage

Clustering

CSS

Data Engineering

Data Engineering

Data Modeling

Database

dbt

Decision Tree

Deep Learning

Descriptive Statistics

Descriptive Statistics

Differential Equation

Differential Equation

Dimensionality Reduction

Dimensionality Reduction

Discrete Choice Model

Discrete Choice Model

Docker

Economics

FastAPI

Firebase

GIS

git

GitHub

GitHub Actions

Google

Google Cloud

Google Search Console

Google Search Console

Hugging Face

Hypothesis Testing

Hypothesis Testing

Inferential Statistics

Inferential Statistics

Interval Estimation

Interval Estimation

JavaScript

Jinja

Kedro

Kubernetes

LightGBM

Linux

LLM

Mac

Machine Learning

Machine Learning

Macroeconomics

Marketing

Mathematical Model

Mathematical Model

Meltano

MLflow

MLOps

MySQL

NextJS

NLP

Nodejs

NoSQL

ONNX

OpenAI

Optimization Problem

Optimization Problem

Optuna

Pandas

Pinecone

PostGIS

PostgreSQL

Probability Distribution

Probability Distribution

Product

Project

Psychology

Python

PyTorch

QGIS

ReactJS

Regression

Rideshare

SEO

Singer

sklearn

Slack

Snowflake

Software Development

Software Development

SQL

Statistical Model

Statistical Model

Statistics

Streamlit

Tabular

Tailwind CSS

TensorFlow

Terraform

Transportation

TypeScript

Urban Planning

Vector Database

Vector Database

Vertex AI

VSCode

XGBoost

Ryusei Kakujo

researchgate

github

Weave the future of cities through data

Transportation modeling/ Urban planning/ Machine learning/ Computer science/ GIS