코딩 없이도, 통계 전문가가 아니어도.
AI를 데이터 분석 파트너로 활용하는 실전 방법을 배웁니다.
✅ 워크플로 — 데이터 수집부터 보고까지 6단계 전체 흐름
✅ 도구 선택 — Claude·ChatGPT·Gemini·전문 도구를 언제 쓸지
✅ 프롬프트 기술 — 데이터 분석에 최적화된 AI 요청법
✅ 함정과 검증 — AI 분석을 맹신하면 안 되는 이유와 검증법
✅ 업종별 사례 — 마케팅·재무·HR·운영 등 실전 7가지 사례
AI가 데이터 분석 업무에서 실제로 무엇을 바꾸는지 구체적으로 파악합니다.
※ 대략적인 작업 시간 단축 추정치. 데이터 성격과 분석 복잡도에 따라 다를 수 있습니다.
| 구분 | ✅ AI가 잘하는 것 | 🧠 사람이 해야 하는 것 |
|---|---|---|
| 데이터 | 정제·변환·이상치 탐색 | 어떤 데이터가 필요한지 판단 |
| 분석 | 통계 계산·패턴 탐색·상관관계 | 인과관계 판단·비즈니스 맥락 해석 |
| 코드 | Python·SQL·엑셀 수식 작성 | 로직이 맞는지 검토 |
| 시각화 | 차트 코드 생성·색상 제안 | 어떤 차트가 메시지를 전달하는지 |
| 보고 | 보고서 초안·요약·제목 | 의사결정으로 연결·책임 |
데이터를 받은 순간부터 보고서 완성까지 전체 흐름을 익힙니다.
작업에 따라 다른 도구를 써야 합니다. 어떤 도구를 언제 쓸지 정리합니다.
AI에게 데이터를 어떻게 설명하고 무엇을 요청해야 좋은 결과를 얻는지 배웁니다.
어떤 차트를 언제 써야 하는지, AI에게 어떻게 요청하는지 알아봅니다.
| 보여주고 싶은 것 | 추천 차트 | AI 요청 키워드 |
|---|---|---|
| 시간에 따른 변화 | 선 그래프 (Line Chart) | "시계열, 추이, 트렌드" |
| 항목 간 크기 비교 | 막대 그래프 (Bar Chart) | "비교, 랭킹, 카테고리별" |
| 전체 중 비율 | 파이/도넛 차트 | "비율, 구성, 점유율" |
| 두 변수 관계 | 산점도 (Scatter Plot) | "상관관계, 분포, 클러스터" |
| 분포 모양 | 히스토그램 / 박스플롯 | "분포, 이상치, 사분위" |
| 여러 변수 관계 | 히트맵 | "상관계수, 매트릭스, 강도" |
| 지역별 데이터 | 지도 시각화 | "지역별, 도시별, 지도" |
AI 분석을 맹신하면 안 되는 이유와, 결과를 검증하는 실전 방법입니다.
실제 업무에서 어떻게 AI 데이터 분석을 적용하는지 7가지 사례를 살펴봅니다.
각 전문가를 클릭하면 데이터 분석의 특정 관점을 깊이 설명합니다.
단계별로 체크하면서 역량을 키워가세요. 진행률이 자동으로 저장됩니다.
12문항으로 핵심 개념 이해도를 점검합니다.
처음 보는 용어가 나오면 바로 여기서 찾아보세요.
자주 쓰는 프롬프트와 체크리스트를 복사해 두세요.
나는 [직무]입니다. [분석 목적]을 위해 데이터를 분석하고 싶습니다. 데이터 구조: - 행 수: [N]행 - 컬럼: [컬럼명1 (타입)] / [컬럼명2 (타입)] / ... - 기간: [날짜 범위] - 특이사항: [결측값 여부, 이상값 의심 등] 분석 목표: 1. [알고 싶은 것 1] 2. [알고 싶은 것 2] 결과물 형태: [Python 코드 / 엑셀 수식 / 보고서 문장] 도구: [Python pandas / Excel / SQL]
다음 데이터를 정제해줘: [데이터 샘플 5~10행 붙여넣기] 정제 목표: 1. 결측값(NaN/빈칸) 처리 — 어떻게 처리할지 추천도 해줘 2. 중복 행 제거 3. 날짜 컬럼을 datetime 형식으로 변환 4. 이상치 탐지 (IQR 방법 사용) 5. 컬럼명 영어_소문자_언더스코어 형식으로 통일 결과: pandas DataFrame 기준 Python 코드로 작성해줘. 각 단계를 주석으로 설명해줘.
다음 데이터의 EDA(탐색적 데이터 분석)를 해줘: 컬럼 정보: [컬럼명과 데이터 타입 목록] 행 수: [N] 다음 순서로 분석해줘: 1. 기초 통계 (평균, 중앙값, 표준편차, min/max) 2. 결측값 현황 및 처리 권고 3. 수치형 컬럼 분포 시각화 (히스토그램) 4. 범주형 컬럼 빈도 분석 5. 수치형 컬럼 간 상관계수 히트맵 6. 이상치 탐지 결과 요약 7. 발견한 주요 패턴 3가지 요약 Python pandas + seaborn + matplotlib으로 작성해줘.
AI 분석 결과 검증 체크리스트 [ ] 1. 샘플 계산: AI가 계산한 수치를 소규모 샘플로 직접 확인했는가? [ ] 2. 상식 점검: 결과가 업무 경험·상식과 크게 다르지 않은가? [ ] 3. 데이터 출처: 분석에 쓰인 데이터가 올바른 기간·범위인가? [ ] 4. 인과관계: 상관관계를 인과관계로 잘못 해석하지 않았는가? [ ] 5. 편향 점검: 샘플이 전체 모집단을 대표하는가? [ ] 6. 코드 실행: 생성된 코드를 실제로 실행해서 오류가 없는가? [ ] 7. 단위 확인: 숫자의 단위(원/달러, 건/명, %)가 일치하는가? [ ] 8. 기간 확인: 비교 대상의 시간 범위가 동일한가? [ ] 9. 결측 처리: 결측값 처리 방법이 분석 목적에 적합한가? [ ] 10. 이해관계: 결과가 특정 방향으로 유도되지 않았는가?
다음 분석 결과를 바탕으로 비즈니스 인사이트를 도출해줘: [분석 결과 / 수치 / 차트 설명 붙여넣기] 나의 상황: - 업종: [업종] - 직무: [직무] - 의사결정 대상: [누구에게 보고/설득할지] 다음 형식으로 정리해줘: 1. 핵심 발견 3가지 (각 1~2문장) 2. 예상되는 원인 (데이터 기반으로) 3. 권고 액션 2~3가지 (구체적이고 실행 가능하게) 4. 추가로 확인이 필요한 데이터나 분석 5. 보고서 Executive Summary 2문단 (임원용)
다음 테이블에서 데이터를 추출하는 SQL을 작성해줘: 테이블 구조: - orders (order_id, user_id, order_date, amount, status) - users (user_id, signup_date, region, tier) - products (product_id, category, price) 목표: [원하는 분석 결과 설명] 기간: [날짜 범위] 필터 조건: [특정 조건] 집계 방법: [SUM/AVG/COUNT 등] 정렬: [어떤 기준으로] DB: [MySQL / PostgreSQL / BigQuery / Snowflake] 가독성 좋게 주석도 달아줘.