ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 분석을 위한 패키지 (1)
    Knowledge for Data Analysis/딥 러닝을 이용한 자연어 처리 입문 2020. 8. 2. 16:58

     

     

    데이터 분석을 위한 패키지에는 Pandas, Numpy, Matplotlib 세 가지가 있다. 해당 패키지들은 모두 아나콘다를 설치하면 자동으로 설치되어져 있다.

    오늘은 그 중 하나인 Pandas 패키지를 공부할 것이다.

     

    판다스(Pandas)

    데이터 처리를 위한 파이썬 라이브러리이다.

     

    판다스에는 '시리즈(Series)', '데이터프레임(DataFrame)', '패널(Panel)' 세 가지 데이터 구조를 사용하는데, 여기서는 시리즈와 데이터프레임에 대해서 알아볼 것이다.

     

    1) 시리즈(Series)

    1차원 배열의 값(values)에 대응되는 인덱스를 부여하는 구조

     

     

    2) 데이터프레임(DataFrame)

    2차원의 리스트를 매개변수로 전달하는, 행과 열을 가지는 자료구조

     

     

    Pandas는 CSV, 텍스트, Excep, SQL, HTMl 등 다양한 데이터 파일을 읽고 데이터 프레임을 생성할 수 있다. 가장 대표적인 예로 pandas.read_csv()로 csv 파일을 읽을 수 있다.

    댓글

Designed by Tistory.