오늘날에는 인문사회는 물론 이공계통의 거의 모든 학문분야에서 통계학을 응용하지 않는 분야가 없는 것이 현실이다. 그 이유로는 각종 분야에서 제기된 질문에 답하기 위해 수집된 자료에 대한 통계적 해석이 필요하고, 한편으로는 데이터를 통계처리하기 위해서는 계산이 필수적이다.
컴퓨터가 개발된 이래로, 통계처리 전용 소프트웨어가 많이 개발되었다. 그 중에서 SAS는 오랜 역사를 가지고 있으며, 오늘날에도 발전하고 있으며, 널리 사용되는 통계처리 전용 소프트웨어 즉, 통계패키지이다.
SAS는 통계처리를 위한 소프트웨어로 시작하였지만, 컴퓨터의 하드웨어 및 소프트웨어의 급격한 발달과, 인터넷과 같은 네트워킹 환경의 일반화 등에 발맞추어 데이터의 수집, 축적, 정보 분석, 정보 활용의 통합적 소프트웨어로서의 길을 걷고 있다.
데이터를 효율적으로 클리닝하는 것은 통계처리에서 매우 중요한 일이며, 다양한 작업이 필요하다. SAS에서는 데이터 클리닝을 위한 다양한 기능이 준비되어 있다. 실제로 이 기능은 SAS의 최대의 강점이라고 할 수 있다.
이 책은 데이터 클리닝에 관한 SAS의 기능과 간략한 통계분석을 다루고 있다. SAS의 데이터 클리닝 기능은 아주 강력하여, 컴퓨터 프로그래밍 언어 수준의 다양한 조절을 아주 간편하게 할 수 있다. 이 책에 나오는 기능을 익히는 것은 SAS의 전문가가 되는 것을 의미한다. 그 다음 단계인 SAS의 통계기법 적용은 패키지 사용의 입장에서 보면 아주 간단하므로 쉽게 해결할 수 있다