KT AIVLE/Daily Review 55

241111

241111미니 프로젝트 4차 day1In [ ]:# 4-2. df에서 '_'이 절반 이상 되는 col 제거# 방법1for col in df.columns: if (df[col]== '_').mean() >= 0.5: df.drop(columns = col, inplace = True)# 방법2: hard codingIn [ ]:# 4-4. '_' 값을 결측치로 변경df.replace({'_': np.nan})In [ ]:# 4-8. 결측치가 있는 col에서 중앙값으로 결측치 채우기# 결측치가 있을 경우에는 .median() 사용 불가m = df.loc[df['age_itg_cd'].notnull(), 'age_itg_cd'].median()df['age_itg_cd'].fillna(m..

241105

2411051. 언어모델의 이해APIAPI: 데이터를 주고받는 상호작용할 수 있게 해주는 인터페이스클라이언트에게 요청받아 서버로 전달, 결과 데이터를 클라이언트로 전달할 때 API를 거침request & responseNLP(Natural Language Processing)자연어 처리(NLP): 컴퓨터가 인간의 언어를 이해가소 생성할 수 있도록 하는 기술, 데이터를 분석하여 의미 파악(맥락 이해)RNN(Recurrent Neural Network)시퀀스 길이에 따라 순차적 정보처리, 시퀀스가 길어질 경우 연산속도 저하장기 의존성: 멀리 떨어진 위치의 정보 연결하기 어려움TransformerRNN 모델 단점 보완구조 복잡문맥 파악에 유리함Transformer의 사용문장의 긍정, 부정 분류학습되지 않은 클..