Traffine I/O

日本語

2023-03-07

SQLのEXISTS

SQLにおけるEXISTS

SQLのEXISTS演算子は、サブクエリの結果の存在をチェックするために使用される関数の一種です。サブクエリから何らかの行が返されるかどうかを調べるのに役立ち、少なくとも1つの行が返された場合はTRUEを返し、行が返されない場合はFALSEを返します。

EXISTSは、SELECTINSERTUPDATEDELETEなどのSQL文で使用することができます。

EXISTSの構文と使用方法

EXISTSを使用する基本的な構文は次のとおりです。

sql
SELECT column_name(s)
FROM table_name
WHERE EXISTS (サブクエリ);

サブクエリはレコードのセットを返すSELECT文です。EXISTSは、サブクエリが少なくとも1つのレコードを返した場合に「true」と見なされます。

EXISTSを説明するために、2つの例としてCustomersOrdersというテーブルを使用します。

Customersテーブル

CustomerID CustomerName ContactName Country
1 Alfreds Maria Germany
2 Ana Trujillo Ana Mexico
3 Antonio Antonio Mexico

Ordersテーブル

OrderID CustomerID OrderDate
1 3 2023-06-25
2 1 2023-07-05
3 2 2023-07-08
4 1 2023-07-08

ここで、注文を行った全ての顧客を見つけたいとします。次のようにEXISTSを使用してこれを行うことができます。

sql
SELECT CustomerName
FROM Customers
WHERE EXISTS (SELECT 1 FROM Orders WHERE Customers.CustomerID = Orders.CustomerID);

このクエリは、Ordersテーブルに少なくとも1つの対応するエントリがある顧客名を返します。

CustomerName
Alfreds
Ana Trujillo
Antonio

EXISTSとINの違い

IN演算子は、指定されたリテラル値のリストと値を比較するために使用されます。ここでは、サブクエリが最初に実行され、結果セットが生成されます。その後、メインクエリが実行され、与えられた値がサブクエリの結果と比較されます。

前の例で使用したCustomersOrdersのテーブルを考えてみます。注文を行った全ての顧客をINを使って見つける場合、クエリは次のようになります。

sql
SELECT CustomerName
FROM Customers
WHERE CustomerID IN (SELECT CustomerID FROM Orders);

サブクエリ(SELECT CustomerID FROM Orders)はCustomerIDのリストを返します。メインクエリでは、CustomersテーブルのCustomerIDがこのリストと一致します。

SQLのEXISTS条件は、サブクエリが何らかの行を返すかどうかをチェックするために使用されます。サブクエリが少なくとも1行を返す場合、EXISTSの結果は「true」です。ほとんどの場合、EXISTSはサブクエリと相関関係があり、サブクエリが外部クエリからの値を参照する場合に使用されます。

注文を行った全ての顧客を見つけるための同じ要件を満たすために、EXISTSを使用する場合のクエリは次のようになります。

SELECT CustomerName
FROM Customers
WHERE EXISTS (SELECT 1 FROM Orders WHERE Customers.CustomerID = Orders.CustomerID);

この場合、外部クエリが最初に実行され、各行ごとにサブクエリが実行され、Ordersテーブルに対応する行が存在するかどうかをチェックします。

主な違い

  • パフォーマンス
    大規模なデータセットを扱う場合、EXISTSは最初の一致を見つけると処理を停止するため、INよりも効率的です。一致が見つかった後も、INは全ての結果をチェックしますが、EXISTSは停止します。

  • NULLの処理
    INEXISTSは、Nullの値を異なる方法で処理します。サブクエリがNULLの値を返す場合、INでは一致しませんが、EXISTSは他の非NULLの一致がある場合でもTRUEを返します。

  • 使用方法
    INは通常、正確な値を知っている場合や、列を特定の値のセットと比較する場合に使用されます。EXISTSは、条件に基づいて行の存在をチェックする際に効率的であり、特にサブクエリが相関関係を持つ場合に有益です。

相関サブクエリと非相関サブクエリ

SQLのサブクエリは大まかに相関サブクエリと非相関サブクエリの2つのタイプに分けることができます。

非相関サブクエリ

非相関サブクエリ、または単純なサブクエリまたは自己完結サブクエリとしても知られるものは、サブクエリが外部クエリと独立して実行できるものです。外部クエリのデータに依存しません。

例として、先ほどのCustomersOrdersのテーブルを考えてみます。特定の国から注文を行った顧客を見つける場合、次のように非相関サブクエリを使用することができます。

sql
SELECT CustomerName
FROM Customers
WHERE Country = 'Mexico' AND CustomerID IN (SELECT CustomerID FROM Orders);

ここでは、サブクエリ(SELECT CustomerID FROM Orders)は外部クエリの情報に依存しません。単に注文を行ったCustomerIDのリストを返します。このリストは外部クエリのIN句によって使用されます。

相関サブクエリ

一方、相関サブクエリは外部クエリのデータに依存します。外部クエリの列または複数の列を参照し、外部クエリが処理する各行ごとにサブクエリが実行されます。

先ほどの目標である注文を行った全ての顧客を見つけるための相関サブクエリを使った場合、EXISTSを使用するクエリは次のようになります。

sql
SELECT CustomerName
FROM Customers
WHERE EXISTS (SELECT 1 FROM Orders WHERE Customers.CustomerID = Orders.CustomerID);

この場合、サブクエリ(SELECT 1 FROM Orders WHERE Customers.CustomerID = Orders.CustomerID)は外部クエリのCustomerIDを参照しています。Customersテーブルの各行に対して、サブクエリが実行され、Ordersテーブルに対応する行の存在をチェックします。

主な違いと使用方法

非相関サブクエリは独立して実行できるため、理解しやすく直感的です。静的なリストや別のSELECT文の結果とデータを比較する必要がある場合に役立ちます。

相関サブクエリは外部クエリのデータに依存するため、外部クエリの各行に対してサブクエリが再実行されます。これは強力な機能ですが、大規模なデータセットではパフォーマンスの問題が発生する可能性があります。相関サブクエリは、結果が外部クエリのデータに依存する場合に使用されます。これにより、より高度なデータ分析や比較タスクが可能になります。

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!