2.表示する列(フィールド)を指定する-SQL経験者のためのR入門

SQLの SELECT FIELD1 FROM TABLE のように、特定の列(フィールド)のみを選択して表示する方法に限定して、R言語での対応を説明します。


🏷️ 列の選択(SELECT FIELD1 FROM TABLE)

SQLで特定の列を選択する SELECT FIELD1 FROM TABLE は、R言語では主に dplyr パッケージの select() 関数を使用して行います。

Rでの基本的な方法(select()関数)

SQLの テーブル は、Rでは データフレーム に相当します。特定の列を選択するには、データフレームの名前の後にパイプ演算子 (%>%) を使い、select() 関数で必要な列名を指定します。

SQLR言語 (dplyr)説明
SELECT name FROM usersusers %>% select(name)データフレーム users から、name 列だけを選択して表示します。
SELECT dept, age FROM usersusers %>% select(dept, age)deptage の2列だけを選択して表示します。

コード例

データフレーム employee_data から、社員のID (employee_id) の列だけを選択する場合:

R

# SQL: SELECT employee_id FROM employee_data

# R言語:
library(dplyr) # dplyrパッケージをロード

employee_data %>%
  select(employee_id)

💡 その他の便利な選択方法

Rの select() 関数は、SQLよりも柔軟に列を選択する方法を提供します。

SQLの意図R言語 (select()関数)説明
複数列を順不同で選択select(age, name, dept)指定した順序で列を選択・表示します。
特定の列を除外select(-phone_number, -address)ハイフン(-)を付けることで、phone_numberaddress以外のすべての列を選択します。
特定のパターンに一致する列select(starts_with("id_"))列名が "id_"始まる列をすべて選択します。

この方法を使えば、SQLの SELECT 句での列指定と同じ感覚で、Rのデータフレームから必要な列だけを抽出・表示できます。