SAS (Statistical Analysis System) är en programvarusvit som används för avancerad analys, affärsintelligens, datamanagement och prediktiv analys. Ursprungligen utvecklad för datamanipulation och statistisk analys, har SAS utvecklats för att inkludera en mängd olika funktioner, inklusive datamining, prognoser och operationsforskning. Det används i stor utsträckning inom olika branscher—särskilt hälso- och sjukvård, finans och akademi—på grund av sina kraftfulla analytiska kapabiliteter och användarvänliga gränssnitt.
SAS utvecklades på 1960-talet vid North Carolina State University av en grupp forskare ledda av Anthony James Barr. Det initiala syftet var att analysera jordbruksdata för att stödja statistiska projekt. Den första versionen av SAS skrevs i assembler-språk och övergick senare till ett mer användarvänligt gränssnitt i form av ett statistiskt paket.
Under 1970-talet började SAS få fäste utanför akademin när företag insåg dess potential för kommersiella tillämpningar. Det första SAS Institute grundades 1976, som sedan dess har expanderat till ett globalt företag som tillhandahåller programvarulösningar och analytiska tjänster. När efterfrågan på dataanalys växte, diversifierade SAS sina erbjudanden för att inkludera affärsintelligensverktyg, dataintegrationslösningar och avancerade analyskapabiliteter.
Idag är SAS en ledare inom analysområdet och erbjuder en omfattande programvarusvit som omfattar ett brett spektrum av statistiska tekniker och metoder. Med framväxten av big data och maskininlärning har SAS anpassat sig genom att integrera artificiell intelligens (AI) och maskininlärnings (ML) kapabiliteter i sin plattform. Dess programvara används i stor utsträckning för efterlevnad och riskhantering inom starkt reglerade branscher, såsom läkemedel och finans.
Kärnan i SAS-programmering baseras på datasteg och procedur (PROC) steg. Datasteg används för datamanipulation, medan PROC-steg används för analys.
data mydata;
input name $ age salary;
datalines;
John 30 50000
Jane 25 60000
;
run;
SAS stöder två typer av variabler: numeriska och tecken. Numeriska variabler kan lagra siffror, medan teckenvariabler kan lagra textsträngar.
data example;
name = "Alice";
age = 28;
run;
SAS tillåter användning av arrayer för effektiv datamanipulation.
data array_example;
array nums(3) x1 x2 x3;
do i = 1 to 3;
nums(i) = i * 10;
end;
run;
SAS tillhandahåller en rad inbyggda funktioner för datatransformation, statistik och strängmanipulation.
data example;
x = abs(-5); /* Absolut värde */
y = length("SAS"); /* Längd på sträng */
run;
SAS tillåter formatering av datavärden med hjälp av format, vilket förbättrar presentationen av utdata.
data formatted;
value = 12345.678;
formatted_value = put(value, dollar8.2); /* Formaterar som $12,345.68 */
run;
Att lägga till etiketter på variabler kan förbättra läsbarheten av utdata.
data labeled;
x = 1;
label x = "Variabel X Etikett";
run;
SAS stöder villkorssatser för datamanipulation.
data conditional;
set mydata;
if age > 30 then status = "Senior";
else status = "Junior";
run;
SAS tillhandahåller syntax för att sammanfoga flera dataset baserat på gemensamma nycklar.
data merged;
merge dataset1 dataset2;
by ID;
run;
SAS inkluderar makroprogrammeringskapabiliteter för dynamisk kodgenerering.
%macro example(data);
data &data;
set &data;
run;
%mend example;
SAS tillhandahåller inbyggda procedurer för att skapa grafiska representationer av data.
proc sgplot data=mydata;
scatter x=age y=salary;
run;
SAS Enterprise Guide är ett allmänt använt grafiskt användargränssnitt (GUI) för SAS som gör det möjligt för användare att bygga projekt med en pek-och-klicka-metod. Andra populära miljöer inkluderar SAS Studio och Base SAS, som erbjuder en mer kodcentrerad metod. SAS Viya är en nyare molnbaserad analysplattform som också stöder SAS-programmering.
För att bygga ett SAS-projekt skriver användare vanligtvis skript i en IDE eller en textredigerare, som sedan körs för att utföra datatransformationer och analyser. Den typiska arbetsflödet involverar att skriva datasteget, följt av ett eller flera PROC-steg för att analysera eller visualisera datan. Utdata kan exporteras till olika format, inklusive CSV, Excel och RTF.
SAS används främst inom industrier som kräver rigorös dataanalys, inklusive:
När man jämför SAS med relevanta programmeringsspråk:
När det gäller käll-till-käll översättning finns det verktyg som "SASTransformer", som kan underlätta konverteringen av SAS-kod till R, Python eller SQL. Men varje språk har unik syntax och bibliotek som kanske inte har direkta motsvarigheter, vilket kräver noggrant övervägande under översättningen.