SQLの SELECT FIELD1 FROM TABLE のように、特定の列(フィールド)のみを選択して表示する方法に限定して、R言語での対応を説明します。
🏷️ 列の選択(SELECT FIELD1 FROM TABLE)
SQLで特定の列を選択する SELECT FIELD1 FROM TABLE は、R言語では主に dplyr パッケージの select() 関数を使用して行います。
Rでの基本的な方法(select()関数)
SQLの テーブル は、Rでは データフレーム に相当します。特定の列を選択するには、データフレームの名前の後にパイプ演算子 (%>%) を使い、select() 関数で必要な列名を指定します。
| SQL | R言語 (dplyr) | 説明 |
SELECT name FROM users | users %>% select(name) | データフレーム users から、name 列だけを選択して表示します。 |
SELECT dept, age FROM users | users %>% select(dept, age) | dept と age の2列だけを選択して表示します。 |
コード例
データフレーム employee_data から、社員のID (employee_id) の列だけを選択する場合:
R
# SQL: SELECT employee_id FROM employee_data
# R言語:
library(dplyr) # dplyrパッケージをロード
employee_data %>%
select(employee_id)
💡 その他の便利な選択方法
Rの select() 関数は、SQLよりも柔軟に列を選択する方法を提供します。
| SQLの意図 | R言語 (select()関数) | 説明 |
| 複数列を順不同で選択 | select(age, name, dept) | 指定した順序で列を選択・表示します。 |
| 特定の列を除外 | select(-phone_number, -address) | ハイフン(-)を付けることで、phone_numberとaddress以外のすべての列を選択します。 |
| 特定のパターンに一致する列 | select(starts_with("id_")) | 列名が "id_" で始まる列をすべて選択します。 |
この方法を使えば、SQLの SELECT 句での列指定と同じ感覚で、Rのデータフレームから必要な列だけを抽出・表示できます。