본문 바로가기

pandas

Python : Python의 Plotly Express로 데이터 시각화 배우기 Plotly Express란?Plotly Express는 Python의 Plotly 라이브러리에서 간단하고 직관적인 데이터 시각화 기능을 제공하는 모듈입니다. 데이터를 시각화하는 과정을 최소화하며, 단 몇 줄의 코드로 강력한 대화형 그래프를 생성할 수 있습니다. 특히 pandas 데이터프레임과 원활히 연동되어 데이터 분석과 시각화를 빠르게 진행할 수 있다는 점이 큰 장점입니다. Plotly Express의 주요 특징 간단한 사용법: 단일 함수 호출로 대화형 그래프 생성.자동 데이터 매핑: 컬럼 이름 기반으로 축, 색상, 크기 등 자동 할당.다양한 차트 지원:• Scatter Plot, Line Chart, Bar Chart• Box Plot, Violin Plot, Histogram 등대화형 기능:• 줌.. 더보기
Python : Pandas 기본 - DataFrame #1 pandas는 Python에서 데이터 분석과 조작을 위해 널리 사용되는 라이브러리입니다. 특히, DataFrame은 pandas의 핵심 데이터 구조로, 구조화된 데이터를 직관적이고 효율적으로 다룰 수 있게 해줍니다. 1. DataFrame의 정의 DataFrame은 행(row)과 열(column)로 구성된 2차원 데이터 구조입니다. 이를 테이블 형태로 생각하면 쉽습니다. 각 열은 특정 데이터 유형을 가지며, 행은 레이블로 식별됩니다. 주요 특징:레코드 기반: 각 행은 레코드를 나타냅니다.열 기반: 각 열은 데이터를 설명하는 속성을 나타냅니다.레이블 지원: 행과 열 모두 레이블을 지정할 수 있어, 인덱스 및 컬럼명을 통해 데이터를 쉽게 접근 가능합니다. 2. DataFrame의 중요성데이터 조작의 용이성:.. 더보기
Python : Pandas Dataframe의 groupby, pivot_Table에 대한 완벽 가이드 Pandas는 데이터 조작과 분석을 위해 설계된 강력하고 유연한 Python 라이브러리입니다. Pandas는 Series와 DataFrame과 같은 기본 데이터 구조를 제공하여 구조화된 데이터를 효율적으로 처리할 수 있습니다. 직관적인 문법과 다양한 기능 덕분에 데이터 과학자, 분석가, 엔지니어들에게 필수 도구로 자리 잡고 있습니다. DataframeDataFrame은 Pandas에서 제공하는 2차원 데이터 구조로, 크기가 변경 가능하며 이질적인 데이터를 담을 수 있습니다. 관계형 데이터베이스의 테이블이나 Excel의 스프레드시트와 유사하며, 행(row)과 열(column)로 구성되어 있습니다. DataFrame은 보통 아래와 같이 사용합니다. import pandas as pddata = { 'N.. 더보기
Python : Pandas 를 이용한 엑셀 작업 예제 CSV를 읽어 피봇 테이블을 만들고 값에 따라 Color Scale 을 적용하는 업무는 자주 있는 일입니다.  이 블로그에서는 Pandas를 사용하여 위와 같은 복잡한 요건을 처리하는 예제를 작성해 봅니다.요건 :  CSV 파일에는 아래와 같은 컬럼이 있다고 가정합니다. 특정 페이지에 링크된 리소스 파일들(html, css, js 등)의 이름과 최적화 전후 파일크기와 감소량을 보여줍니다.PageName, fileName, before, after, gz_before, gz_after, saving, gz_saving 한 페이지에는 여러 리소스들이 존재하고, 여러 페이지에 공통으로 존재하는 파일들도 많기 때문에 리소스 파일이름(fileName) 으로 그룹핑하여  특정 파일에 어떤 페이지들이 얼마만큼 최적화.. 더보기