７．UNION ALL-SQL経験者のためのR入門

SQLの UNION ALL 演算子について解説します。

🔗 UNION ALL 演算子による結果セットの統合（重複保持）

🔗 UNION ALL 演算子による結果セットの統合（重複保持）

UNION ALL 演算子は、複数の SELECT クエリの結果セットを縦方向に結合するために使用されます。UNION と異なり、重複する行を削除せずにそのまま保持するのが最大の特徴です。

1. 動作の仕組み

UNION ALL は、以下の処理を非常に高速に行います。

結果セットの結合: 最初の SELECT クエリ (TABLE1) と二番目の SELECT クエリ (TABLE2) の結果を、単に順番に連結して一つの大きな結果セットとして結合します。
重複の保持: 結合された結果セット全体をスキャンして重複をチェックするソート処理を行いません。そのため、処理速度が速く、結果には元のテーブルに含まれていたすべての行（重複行も含む）が含まれます。

2. 利用条件とメリット

UNION ALL を使用するためのルールは UNION と同様に厳格です。

📝 利用条件

列の数、順序、データ型: 結合するすべての SELECT クエリで、選択する列の数、並び順、およびデータ型が互換性を持っている必要があります。

🚀 メリット（利用シーン）

メリット	利用シーン
高速性	重複排除の処理（ソート）がないため、`UNION` よりも圧倒的に速いです。
完全性	元のデータが持つすべての行（重複も含む）を正確に把握したい場合に利用します。
ログ・履歴データ	月別や日別に分かれたログテーブルを結合し、重複も含めたすべてのトランザクションを分析する場合など。

3. R言語 (dplyr) での対応方法

R言語では、dplyr パッケージの bind_rows() 関数が、SQLの UNION ALL 演算子と完全に同じ機能（縦方向の結合と重複の保持）を提供します。

🚀 Rコードの対応

# SQL: SELECT FIELD1 FROM TABLE1 UNION ALL SELECT FIELD1 FROM TABLE2

# R言語:
library(dplyr)

# 1. 結合前に、両方のデータフレームでFIELD1だけを選択する
table1_data <- TABLE1 %>% select(FIELD1)
table2_data <- TABLE2 %>% select(FIELD1)

# 2. UNION ALL (縦結合と重複保持) を実行
bind_rows(table1_data, table2_data)

演算子	目的	R言語の対応関数
UNION ALL	重複を保持したまま結合	`bind_rows()`
UNION	重複を排除して結合	`union()`

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31