SAS(Statistical Analysis System)は、高度な分析、ビジネスインテリジェンス、データ管理、予測分析に使用されるソフトウェアスイートです。元々はデータ操作と統計分析のために開発されましたが、SASはデータマイニング、予測、オペレーションリサーチなど、幅広い機能を含むように進化しました。その強力な分析能力とユーザーフレンドリーなインターフェースにより、特に医療、金融、学術界など、さまざまな業界で広く利用されています。
SASは1960年代にノースカロライナ州立大学で、アンソニー・ジェームズ・バーが率いる研究者グループによって開発されました。最初の目的は、統計プロジェクトを支援するための農業データの分析でした。SASの最初のバージョンはアセンブラ言語で書かれ、その後、よりユーザーフレンドリーなインターフェースを持つ統計パッケージに移行しました。
1970年代には、企業が商業アプリケーションの可能性を認識するようになり、SASは学術界の外でも注目を集め始めました。1976年に最初のSASインスティテュートが設立され、以来、ソフトウェアソリューションと分析サービスを提供するグローバル企業に成長しました。データ分析の需要が高まる中、SASはビジネスインテリジェンスツール、データ統合ソリューション、高度な分析機能を含むように提供内容を多様化しました。
現在、SASは分析分野のリーダーであり、幅広い統計手法と方法論を網羅した包括的なソフトウェアスイートを提供しています。ビッグデータと機械学習の台頭に伴い、SASは人工知能(AI)や機械学習(ML)機能をプラットフォームに組み込むことで適応しています。そのソフトウェアは、製薬や金融などの高度に規制された業界におけるコンプライアンスとリスク管理において広く依存されています。
SASプログラミングの核心はデータステップと手続き(PROC)ステップに基づいています。データステップはデータ操作に使用され、PROCステップは分析に利用されます。
data mydata;
input name $ age salary;
datalines;
John 30 50000
Jane 25 60000
;
run;
SASは数値型と文字型の2種類の変数をサポートしています。数値型変数は数値を格納でき、文字型変数はテキスト文字列を格納できます。
data example;
name = "Alice";
age = 28;
run;
SASは効率的なデータ操作のために配列の使用を許可しています。
data array_example;
array nums(3) x1 x2 x3;
do i = 1 to 3;
nums(i) = i * 10;
end;
run;
SASはデータ変換、統計、文字列操作のためのさまざまな組み込み関数を提供しています。
data example;
x = abs(-5); /* 絶対値 */
y = length("SAS"); /* 文字列の長さ */
run;
SASはフォーマットを使用してデータ値のフォーマットを行い、出力のプレゼンテーションを向上させます。
data formatted;
value = 12345.678;
formatted_value = put(value, dollar8.2); /* $12,345.68としてフォーマット */
run;
変数にラベルを追加することで、出力の可読性を向上させることができます。
data labeled;
x = 1;
label x = "変数Xのラベル";
run;
SASはデータ操作のための条件文をサポートしています。
data conditional;
set mydata;
if age > 30 then status = "シニア";
else status = "ジュニア";
run;
SASは共通のキーに基づいて複数のデータセットをマージするための構文を提供しています。
data merged;
merge dataset1 dataset2;
by ID;
run;
SASは動的コード生成のためのマクロプログラミング機能を含んでいます。
%macro example(data);
data &data;
set &data;
run;
%mend example;
SASはデータのグラフィカルな表現を作成するための組み込み手続きを提供しています。
proc sgplot data=mydata;
scatter x=age y=salary;
run;
SAS Enterprise Guideは、ユーザーがポイントアンドクリック方式でプロジェクトを構築できるSASの広く使用されているグラフィカルユーザーインターフェース(GUI)です。他の人気のある環境には、よりコード中心のアプローチを提供するSAS StudioやBase SASがあります。SAS Viyaは、SASプログラミングをサポートする新しいクラウドベースの分析プラットフォームです。
SASプロジェクトを構築するために、ユーザーは通常、IDEまたはテキストエディタでスクリプトを書き、それを実行してデータ変換や分析を行います。典型的なワークフローは、データステップを書いた後、データを分析または視覚化するための1つ以上のPROCステップを続けることです。出力はCSV、Excel、RTFなどのさまざまな形式にエクスポートできます。
SASは、厳密なデータ分析を必要とする業界で主に使用されています。これには以下が含まれます:
SASを関連するプログラミング言語と比較すると:
ソースからソースへの翻訳に関しては、「SASTransformer」のようなツールがあり、SASコードをR、Python、またはSQLに変換するのを容易にします。ただし、各言語には独自の構文とライブラリがあり、直接的な同等物がない場合があるため、翻訳時には慎重な考慮が必要です。