본문 바로가기

IT.데이터8

빅데이터 분석기사 실기 - 작업형 1유형 준비 / 2회, 3회, 4회, 5회 기출 변형 핵심 코드 공유 이번 포스팅은 빅데이터 분석기사 실기 작업형 1유형 - 2회, 3회, 4회, 5회 기출 변형을 토대로 작업형 1유형을 대비해보겠습니다. 아래의 링크에 있는 데이터마님 페이지에서 문제를 가져와보았습니다. 이전 포스팅처럼 나와있는 해석이 아닌 더 쉬운 풀이로 풀어보겠습니다 https://www.datamanim.com/dataset/practice/ex2.html 2회 기출 변형 — DataManim 3-1-c 위의 통계량에 대한 p-값을 구하고 (반올림하여 소숫점 이하 3째자리), 유의수준 0.05하에서 귀무가설과 대립가설중 유의한 가설을 하나를 선택하시오(귀무/대립) www.datamanim.com #2-1 A = df['CRIM'].sort_values(ascending=False).head(10) p.. 2023. 6. 22.
빅데이터 분석기사 실기 - 작업형 2유형 준비 / 2회 기출 변형 해설 https://www.datamanim.com/dataset/practice/ex2.html 이 포스팅은 빅데이터 분석기사 2회 기출 변형 - 작업형 2유형을 토대로 작업형 2유형을 대비해보겠습니다. 참고로 위의 링크에 있는 데이터마님 페이지에서 문제를 가져와보았습니다. 나와있는 해석이 아닌 더 쉬운 풀이로 풀어보겠습니다. 1. 문제 해석 고객 구매 데이터를 사용해서 고객이 주문한 물품이 제 시간에 도착여부(Reached.on.Time_Y.N) 예측 X_train.csv, y_train.csv : 학습 및 학습평가에 사용하는 파일 X_test.csv : 제출용 데이터 생성에 사용하는 파일 roc_score를 사용하여 평가 아래의 형식으로 submission수험번호.csv 로 저장 Reached.on.Ti.. 2023. 6. 22.
빅데이터 분석기사 실기 - 작업형 2유형 준비 / 평가 함수, 사용 라이브러리 import 본 포스팅은 작업형 2유형의 실습을 위해 작성하겠습니다. 이번 시간에는 평가 함수, 사용 라이브러리 import에 대해 알아보겠습니다. 실습 코드 위주로 작성하였으며 필요한 부분을 숙지하시어 실기 시험에 주요 키 포인트로 쓰시길 바라겠습니다. 작업형 2유형의 경우 여러 함수가 쓰입니다. 그 중 문제에 따라, 2항 분류, 다항 분류, 회귀로 문제가 설정이 됩니다. 각각의 특징에 따라 사용되는 함수가 달라집니다. 평가 함수 1. 2항 분류 #2항 분류 from sklearn.metrics import roc_auc_score, f1_score def get_scores(model, x_train, x_test, y_train, y_test): A = model.score(x_train, y_train) # .. 2023. 6. 20.
빅데이터 분석기사 실기 - 작업형 3유형 준비 / 카이제곱, 피셔의 정확 검정 (Fisher's Exact Test), 비모수 검정 작업형 3유형의 출제될 문제 중 하나인 카이제곱에 대해 다루겠다. 실제 실습에서 어떻게 쓰이는 지 위주로 적겠다. 카이제곱 종류 ▪ 한 개 범주형 변수와 각 그룹 별 비율과 특정 상수비가 같은 지 검정하는 적합도 검정(The Goodness of Fit Chi-Square) ▪ 각 집단이 범주형 변수에 대해 서로 유사한 성향을 갖는지 분석하는 동질성 검정 ▪ 두 개 범주형 변수가 서로 독립인지 검정하는 독립성 검정 카이-제곱 적합도(The Goodness of Fit Chi-Square) ( 가설 ) 검정 ▪ 모집단의 어떤 확률 분포를 가설로 설정한 후, 표본 자료의 분포를 분석해 모집단 가설에 대한 타당성 검증 ▪ 𝒏개 범주에 대한 비율을 𝑷𝟏,𝑷𝟐, … ,𝑷𝒏 으로 정의할 때 귀무가설 : 𝑷𝟏 = 𝑷.. 2023. 6. 20.