분류 전체보기 46

24-01-10 통계

1) 표본평균의 분포는 중심극한정리에의해 결국 정규분포에 가까워집니다. 2) 관측된 자료의 수 (=N)가 30이상일때는 모수가 정규분포를 따르지 않더라도 정규분포로 인정합니다. 3) 뚜렷한 관측값이 있을때는 귀무가설이 아닌 대립가설을 사용합니다. 4) 유의확률 (p value)가 0.05이상일때는 귀무가설을 채택하고 0.05미만일때는 귀무가설을 기각 즉, 대립가설을 채택합니다. 5) 검정통계량-알파(α) 혹시 틀린부분이 있다면 알려주세요. 요약변수와 파생변수 요약변수 : 수집된 정보를 분석에 맞에 종합한 변수, 많은 모델이 공통으로 사용할수있어 재활용성 높다 )기간별/상품별 구매금액, 횟수 파생변수 : 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수 (논리적 타당성 필요) ) 근..

수업외 정리 2024.01.11

240108복습 시각화

#라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import numpy as np tips = sns. load_dataset ("tips") fig, ax =plt.subplots() #그래프 틀 ax.plot([1, 2, 3]) #그래프 속의 수치 sns.scatterplot(x = 'total_bill', y= 'tip', hue = 'sex', ax = ax, data= tips) ##plt.savefig("output/result.png") #output 폴더에 png 로 저장 (주피터랩) plt.show() #matplot lib seaborn 동시에 사용subplotting 기법 fig,..

수업외 정리 2024.01.09

240108복습 데이터 통합하기

##데이터 통합하기 import pandas as pd import numpy as np df1 = pd.DataFrame({ 'Class1' : [95, 92, 98, 100], 'Class2' : [91, 93, 97, 99] }) df2 = pd.DataFrame({ 'Class1' : [87,89], 'Class2' : [85,90] }) df2 df1.append(df2) # 판다스버전 1.4.0 이후로 append 지원하지않음 , 'method' will be deprecated 에러 에러확인하여 공식 웹사이트 확인 필요 #concat 으로 대체 pd.concat() result = pd.concat([df1,df2]) result df3 = pd.DataFrame({ 'Class1' :[96..

수업외 정리 2024.01.08

240108복습 merge

https://r4ds.had.co.nz/relational-data.html df_A_B = pd.DataFrame({'판매월': ['1월', '2월', '3월', '4월'], '제품A': [100, 150, 200, 130], '제품B': [90, 110, 140, 170]}) df_C_D = pd.DataFrame({'판매월': ['1월', '2월', '3월', '4월'], '제품C': [112, 141, 203, 134], '제품D': [90, 110, 140, 170]}) df_C_D df_A_B.merge(df_C_D) df_A_B.join(df_C_D) ##에러## join 은 칼럼이 중복되면 에러가 뜬다 df_left = pd.DataFrame({'key':['A','B','C'], 'le..

수업외 정리 2024.01.08