Python

DAY 7 ( 라이브러리, Numpy, Boolean indexing, Pandas )

도키마 2024. 6. 24. 16:35

 

 

 

 

 

 

오늘의 노래 추천 👧

 

 
Small girl (feat. 도경수(D.O.))
아티스트
이영지
앨범
16 Fantasy
발매일
2024.06.21

 

뮤비가 너무 귀여워요...이거말고 tell me <ㅡ 이것도 좋음

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DAY 7

 


 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ㅡ 복습 ㅡ

 

Numpy ndarray

 

 

 

 

 

 

 

ndarray 클래스

 

 

 

 

 

 

 

 

 

 

 




 

 

 

 

 

 

 

 

 

 

 

 

 

ㅡ Boolean Indexing ㅡ

 

* Boolean 색인true 에 해당하는 값만 불러옴

 

 

 

 

 

 

 

 

 

 

 

boolean 인덱싱

 

 

 

boolean 인덱싱

 

bigdata 에서 '혜민' index 번호와 같은 데이터를 불러옴

 





 

 

 

 

 

 


[ 평점 분석 실습 예제  ]

 

 

 

 

 

 

ㅡ ratings 자료 가져오기 ㅡ

 

genfromtxt

 

np.genfromtxt 사용


 

 

 

ㅡ 평점 평균 구하기 ㅡ

 

평점 평균 구하기

 

 

 

 

 

 

ㅡ user_id 중복 제거 후 출력 ㅡ

 

user_id 중복 제거

 

 

 

 

 

 

ㅡ 1번 사용자의 전체 정보 출력 ㅡ 

 

1번 사용자의 전체 정보 출력

 

 

== 비교 연산자를 이용해 boolean 색인 활용

 



 

 

 

ㅡ 1번 사용자의 평점 평균 ㅡ 

 

평점 평균

 



 

 

 

ㅡ 전체 사용자의 평점 평균 구하기 ㅡ 

 

전체 평점 평균

 

 



 

 

 

ㅡ 각 사용자의 평점 평균 구하기 ㅡ 

 

사용자 아이디

 

np.unique 사용해 중복 제거

 

 

 



 

 

ㅡ id 와 평점 평균 불러오기 ㅡ 

 

평점 평균 list

 

 

but,

 

단순 list 이기 때문에 boolean 색인 사용불가

np.array 클래스에 담아줘야함

 



 

 

ㅡ np.array 에 데이터 저장 ㅡ 

 

np.array

 

 




 

 

ㅡ 평균 평점이 4점 이상인 사용자 boolean 색인 ㅡ 

 

평점 4 이상 출력

 

 

bool 변수에 평균 평점이 4 이상인 유저 정보를 저장하고

id 값을 int 로 변환해 출력 ( astype 사용)

 

 

 

 

 

 




 

 

ㅡ 평균 평점이 min, max인 사용자 boolean 색인 ㅡ 

 

 

min 평점

 

 

max 평점

 

 

 

 

 

 

 

 



ㅡ np.array 값 txt 파일로 저장하기 ㅡ 

 

 

savetxt

 

savetxt 함수 사용

 

 

 




 

 

 

 

 

 

[ Pandas ]

 

pandas library

 

 

 

 

 

 

 

pandas library

 

 

1차원 데이터는 '시'리즈 ( 첫글자 대문자 )

인덱스 + 값

2차원 데이터는 '데'이터 프래임 ( 첫글자 대문자 )

표와 같은 형태

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 


 


 


 

 

 

 

 

Bye