top 30 sas interview questions
Liste over de mest populære hyppigt stillede SAS interviewspørgsmål med svar:
I denne artikel vil vi se på nogle af de grundlæggende såvel som avancerede koncepter i SAS-programmering gennem hyppigst stillede SAS-spørgsmål og svar.
Statistisk analysesystem, almindeligvis kendt som SAS, betragtes som et sæt multipel software, der er integreret og bruges til forskellige operationer som Data Management, Predictive - Perspective & Descriptive Analysis, Quality Improvement, Business Analysis, Application Development osv.
SAS store antal komponenttilpasning såvel som omfattende programmeringsmetode fungerer sammen, udfører dataanalyse og datatransformationsopgaver. Det kan køre på ethvert operativsystem (Linux, Windows osv.), Da det er platformuafhængigt.
Mest populære SAS-spørgsmål og svar
Nu sker det..
Q # 1) Anvend de funktioner, der udføres af SAS.
Svar: SAS (Statistical Analysis System) har sin egen betydning i ethvert forretningsdomæne.
Nedenfor er nogle af de opsummerede funktioner, der udføres af SAS:
- Datastyring og projektledelse
- Datalagring
- Operationel forskning og beslutningsstøtte
- Informationssøgning og kvalitetsstyring
- Forretningsplanlægning
- Statistisk analyse
Q # 2) Hvad er de 3 komponenter i SAS programmering?
Svar: De 3 komponenter i SAS programmering er:
- Erklæringer
- Variabler
- Datasæt
Q # 3) Anvend de syntaksregler, der følges i SAS-udsagn.
Svar: SAS-programmet er skrevet i Editor-vinduet. Her indeholder den en række udsagn efterfulgt af den korrekte syntaks i en rækkefølge, som SAS-programmet skal forstå det.
Nogle af de syntaksregler, der følges i tilfælde af erklæringskomponent i SAS, er som følger:
- Slutningen af enhver erklæring er markeret med et semikolon (;).
- Et semikolon bruges også til at adskille flere udsagn, der vises på en enkelt linje.
- SAS-udsagn er ikke store og små bogstaver, og ekstra afstand inden udsagn fjernes automatisk.
- Kommentarer kan inkluderes i SAS-programmet til udsagn på to forskellige måder som:
- En linje, der begynder med en stjerne (*) og slutter med et semikolon (;).
- En linje, der begynder med en skråstreg og en stjerne (/ *) og slutter med en stjerne og en skråstreg (* /).
Spørgsmål nr. 4) Hvad er de datatyper, som SAS indeholder?
Svar: 'Numerisk' og 'Karakter' er de to typer datatyper, som SAS-programmet indeholder.
Q # 5) Hvad er PDV og deres funktioner?
Svar: Program Data Vector (PDV) er et logisk koncept og defineres som et hukommelsesområde, hvor et datasæt bygges af SAS.
Funktioner af PDV er som følger:
- Der oprettes en database med en observation ad gangen.
- Inputbufferen til opbevaring af data fra en ekstern fil oprettes på tidspunktet for kompilering.
- PDV indeholder to automatiske variabler, nemlig _N_ (viser antallet af datatrin, der udføres) og _ERROR_ (giver besked om den fejl, der opstår på tidspunktet for udførelsen).
Spørgsmål nr. 6) Hvad ved du om SAS-datasættet?
Svar: SAS-datasæt kaldes grundlæggende de data, der er tilgængelige til analyse inden for et SAS-program. SAS-datasæt kaldes også SAS-datatabellen.
SAS datatabel består af to dele:
- Kolonner med variabler
- Rækker af observationer
Nyttige oplysninger om SAS-datasættet kan opsummeres som følger:
- SAS datasæt kan læse så godt som det har indbyggede datakilder til brug som Excel, Access osv.
- Datasættet, der kun bruges i den aktuelle session, køres og kasseres, efter at sessionen slutter, er kendt som midlertidigt datasæt.
- Datasættet, der er gemt til brug i den fremtidige session, er også kendt som det permanente datasæt.
- Det indbyggede datasæt kan tilgås ved hjælp af denne sti Biblioteker -> Mine biblioteker-> SASHELP.
Spørgsmål nr. 7) Forklar, hvorfor dobbelt trailing @@ bruges i Input Statements?
Svar: Under datatrin gentages iteration, inklusive dobbelt trailing @@ i Input-udsagn, at SAS skal holde den aktuelle rekord med henblik på udførelse af den næste Input-sætning i stedet for at skifte til den nye post.
Q # 8) Forklar forskellen mellem NODUP- og NODUPKEY-muligheder?
Svar: For at fjerne duplikatværdier fra tabellen, PROC SORT er grundlæggende kategoriseret mellem to muligheder:
- NODUP
- NODUPKEY
Forskellen mellem disse to muligheder kan ses nedenfor:
NODUPKEY | NODUP |
---|---|
Sammenligner bare BY-variablen, der findes i datasættet. | Sammenligner alle de variabler, der findes i datasættet. |
Fjerner duplikatindstillinger for værdierne for variablen, der er anført i BY-sætningen. | Identificerer og fjerner dobbelte observationer. |
Syntaks: PROC SORT DATA = readin NODUPKEY; BY variabelnavn; LØB; | Syntaks: PROC SORT DATA = readin NODUP; BY variabelnavn; LØB; |
Q # 9) Hvilken kommando bruges til at udføre sortering i SAS-programmet?
Svar: PROC SORT-kommandoen bruges til at udføre sortering, det være sig på en enkelt variabel eller flere variabler. Denne kommando udføres på datasættet, hvor det nye datasæt oprettes som et resultat af sortering, men det originale datasæt forbliver uændret.
Syntaks:
PROC SORT DATA=original OUT=Sorted; BY variable;
Hvor,
'Original' henviser til det originale datasæt
'Sorteret' henviser til resultatet som sorteret datasæt
'Variabel' henviser til den kolonne, som sorteringshandling udføres på.
Sortering kan udføres i både stigende og faldende rækkefølge.
For at datasættet skal vises i faldende rækkefølge, bruges nøgleordet 'Descending' i BY-sætningen med kolonnenavnet, som sortering skal udføres på.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Q # 10) Forklar forskellen mellem Informat og Format med et eksempel.
Svar: Forskellen mellem Informat og Format kan forklares som:
Find ud af mere | Format |
---|---|
Angiv SAS, hvordan man læser data i SAS-variablen. | Angiv SAS, hvordan værdier vises i variablen. |
Disse bruges til at læse dataene eller tage inputdata fra eksterne filer. | Disse bruges til at skrive dataene. |
Q # 11) Differentier INPUT og INFILE.
Svar: Inkludering af en INFILE-sætning i SAS-programmeringen identificerer en ekstern fil, der består af dataene, mens inkludering af INPUT-sætning i SAS-programmering beskriver de anvendte variabler.
Syntaksen for INFILE:
INFILE ‘filename’;
Syntaksen for INPUT:
INPUT ‘varname1’ ‘varname2’;
Spørgsmål nr. 12) Forklar brugen af PROC-udskrivning og PROC-indhold?
Svar: PROC-trinnet i SAS-programmet bruges til at påberåbe indbyggede procedurer til analyse af datasættets data.
PROC-udskrivning: Sikrer at dataene i datasættet læses korrekt.
PROC indhold: Viser oplysningerne om SAS-datasættet.
Q # 13) Forklar DATA_NULL_?
Svar: Som navnet definerer, er DATA_NULL_ et datatrin, der faktisk ikke opretter noget datasæt.
Det bruges til:
- Oprettelse af makrovariabler.
- Skrivning af output uden datasæt.
Spørgsmål nr. 14) Hvordan konverteres tegnvariabel til en numerisk variabel og omvendt?
Svar: Under SAS-programmering opstår der mange opgaver, hvor en tegnværdi skal konverteres til det numeriske, og på samme måde skal en numerisk værdi konverteres til en tegnværdi.
SÆTTE() bruges til at konvertere numerisk til tegn. I dette tilfælde skal kildeformatet og kildevariabeltypen altid være ens.
Eksempel:
char_var= PUT( num_var, 6.);
INPUT () bruges til at konvertere et tegn til numerisk. I dette tilfælde skal kildevariabeltypen altid være tegnvariabler.
Eksempel:
Num_var= INPUT(char_var,2.0);
Q # 15) Hvad er formålet med _CHARACTER_ og _NUMERIC_?
Svar: I det aktuelle datasæt
_KARAKTER_ definerer alle de tegnvariabler, der aktuelt er defineret.
Eksempel : For at inkludere alle tegnvariablerne i PROC MEANS bruges følgende udsagn:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definerer alle de numeriske variabler, der aktuelt er defineret.
Eksempel: For at inkludere alle de numeriske variabler i PROC MEANS anvendes følgende udsagn:
PROC MEANS; Var_numeric_; Run;
Q # 16) Hvilke kommandoer bruges i tilfælde af at inkludere eller ekskludere specifikke variabler i datasættet?
Svar: DROP-, KEEP- og datasætindstillinger bruges til dette formål.
Den variabel, vi vil fjerne fra datatrin, er specificeret i DROP-sætningen.
Den variabel, vi vil beholde fra datatrin, er specificeret i KEEP-sætningen.
Q # 17) Skel mellem PROC-MIDLER og PROC-RESUMÉ.
Svar: Forskellen mellem PROC MEANS og PROC RESUMÉ kan forstås som følger:
PROC betyder | PROC RESUMÉ |
---|---|
Denne procedure producerer som standard den udskrevne rapport i vinduet OUTPUT. | Denne procedure inkluderer PRINT i erklæringen for at producere den trykte rapport. |
PROC betyder som standard alle de numeriske variabler i analysen. | PROC SAMMENDRAG tager variablerne ind i den statistiske analyse, der er beskrevet i VAR-sætning. |
Q # 18) Forklar formålet med SUBSTR-funktioner i SAS-programmering.
Svar: Når der i SAS-programmering er krav om, at programmet skal abstrakte en understreng, bruges SUBSTR-funktionen i tilfælde af en tegnvariabel.
Når en startposition og længde er angivet, bruges denne funktion til at abstrahere tegnstreng.
Syntaks: SUBSTR (char_var, start, længde);
Q # 19) Navngiv og beskriv få SAS-karakterfunktioner, der kort fortalt bruges til datarensning.
Svar: Få SAS-karakterfunktioner, der bruges til datarensning, er angivet nedenfor:
- Komprimer (char_string) funktion bruges til at fjerne blanks eller nogle specificerede tegn fra en given streng.
- TRIM (str) funktion bruges til at fjerne efterfølgende emner fra en given streng.
- LOWCASE (char_string) funktion bruges til at konvertere alle tegn i en given streng til små bogstaver.
- UPCASE (char_string) funktion bruges til at konvertere alle tegn i en given streng til store bogstaver.
- COMPBL (str) funktion bruges til at konvertere flere emner til et enkelt emne.
Q # 20) Nævn nogle få måder, hvorpå en 'tabelopslag' udføres i SAS-programmering.
Svar: I SAS-programmering kan tabelopslagsværdierne gemmes på følgende måder:
- Kode
- Array
- Hash-objekt
- Format
- Datasæt
Følgende teknikker bruges til at udføre 'tabelopslag' i henholdsvis SAS:
- SELECT / WHEN eller IF / THEN udsagn
- Array Index-værdi
- Hash-nøgleværdi
- FORMAT-sætning, PUT-funktion
- Flet, deltag, KEY = Option
Lad os se et eksempel, der viser 'Code' måde at udføre tabelopslag på ved hjælp af 'IF / THEN' udsagn:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Q # 21) Skel mellem CEIL- og FlOOR-funktioner.
Svar: CEIL-funktion bruges til at afkorte numeriske værdier, hvor den viser output som det mindste heltal. Ved det mindste heltal betyder her, at heltalets værdi er større end / lig med argumentet.
Eksempel: CEIL (12.85) viser output som 13.
GULV-funktion bruges til at afkorte numeriske værdier, hvor den viser output som det største heltal. Ved største heltal betyder her, at heltalets værdi er mindre end / lig med argumentet.
Eksempel: FLOOR (12.85) viser output som 12.
Spørgsmål nr. 22) Hvad er de måder, hvorpå makrovariabler kan oprettes i SAS-programmering?
Svar: Nå kan en række forskellige teknikker bruges til at skabe makrovariabler i SAS-programmering.
Nedenfor er de fem mest anvendte metoder:
- % LET-erklæring
- Makroparametre (navngivet såvel som positionel)
- % DO-sætning (iterativ)
- INTO i PROC SQL
- OPKALD SYMPUTX-rutine
Q # 23) Forklar formålet med RETAIN-udsagnet.
Svar: Som betydningen af ordet 'RETAIN' betyder at beholde værdien, når den er tildelt, er formålet med RETAIN-sætningen det samme i SAS-programmering, som det betyder.
Inden for et SAS-program, når det er nødvendigt at flytte fra den aktuelle iteration til det næste af datatrinet, fortæller RETAIN-erklæringen på det tidspunkt SAS at beholde værdierne i stedet for at indstille dem til manglende.
Eksempel: Lad os udskrive et program, der viser outputværdien af 'z' startende fra 1 ved hjælp af RETAIN-sætningen.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Spørgsmål nr. 24) Hvilken kommando bruges til at gemme logfiler i den eksterne fil?
Svar: TRYKT PROCESS kommando bruges til at gemme logfiler i den eksterne fil.
hvad man skal åbne xml filer med
Eksempel:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Q # 25) Nævn nogle almindelige fejl, der normalt begås i SAS-programmering.
Svar: Nedenfor er nogle af de almindelige fejl, der normalt begås, især når du er ny på dette programmeringssprog.
- Den grundlæggende syntaks inkluderer et semikolon i slutningen af hver udsagn, og manglende semikolon er den mest almindelige fejl.
- Du springer over at kontrollere logfiler efter indsendelse af programmet.
- Kommentarfejl som manglende brug af kommentarer, hvor det er nødvendigt, eller brug af kommentarer på en upassende måde.
- Brug ikke de rette fejlretningsmetoder.
Q # 26) Nævn SAS-systemindstillinger for fejlretning af SAS-makroer.
Svar: For at hjælpe med at spore makrokoden såvel som SAS-koden, der genereres af makroerne, kan nogle systemindstillinger bruges.
De er:
- MLOGIC
- MPRINT
- SYMBOLER
Beskeden, der genereres af disse systemindstillinger, kan ses i SAS-logfilen.
Q # 27) Skel mellem SAS-funktioner og SAS-procedurer.
Svar: De største forskelle kan opdages / forstås af den sag, der er forklaret for både SAS-funktioner og procedurer.
Sag:
Til Fungere , argumentværdien tilvejebringes eller sige taget til beregning på tværs af observationen nævnt i programerklæringen, hvorimod i tilfælde af Procedure forventes hver observation kun at have en variabel, gennem hvilken beregning foretages som nævnt i nedenstående eksempel.
Lad os forstå det med eksempler:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Her i eksemplerne ovenfor tages de argumenter, der sendes til middelfunktionen, til beregning som en observation.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Her i ovenstående eksempel beregner Proc-funktion funktionen gennemsnitstemperaturen for et argument, der sendes som en observation, dvs. efter måned.
Spørgsmål nr. 28) Hvad ved du om SYMPUT og SYMGET?
Svar: De største forskelle mellem de to er nævnt nedenfor.
SYMPUT bruges til at gemme værdien af et datasæt i makrovariablen, mens SYMGET bruges til at hente værdien fra makrovariablen til datasættet.
Q # 29) Forklar de specielle inputafgrænsere, der bruges i SAS-programmering.
Svar: De specielle inputafgrænsere, der bruges i SAS-programmering, er:
- DLM
- DSD
De bruges i udsagnet 'INFILE', og DSD har den funktionalitet at ignorere de afgrænsere, der vises omgivet af anførselstegn.
Spørgsmål nr. 30) Hvilken funktion bruges til at tælle antallet af intervaller mellem to SAS-datoer?
Svar: Intervalfunktion INTCK bruges til at tælle antallet af intervaller mellem to givne SAS-datoer.
Syntaks:
INTCK(interval,start-of-period,end-of-period)
Konklusion
Indtil videre har vi set flere spørgsmål og svar, som ville have givet dig en klar forståelse af SAS programmeringskoncepter samt givet dig en idé om arten af spørgsmål, der stilles i SAS interviews.
Nå, hvis du er ny inden for SAS-programmering, vil viden om nogle teknologier inden for computerprogrammering og fortrolighed med SQL (Structured Query Language) være en ekstra fordel for dig til forståelse såvel som at lære SAS hurtigt.
Håber, du er klar til at møde ethvert SAS-interview med tillid !!