본문 바로가기

DA/Python14

[과제] 파이썬, pandas https://www.notion.so/teamsparta/7-Python-20d2dc3ef5148028aabcc738ded2a8d2[파이썬]1. 숫자 리스트 평균 계산-내가 쓴 답#1.주어진 재고의 평균을 계산. 함수명: calculate_stock(numbers)numbers = [10, 20, 30, 40, 50]def calculate_stock(numbers): total = 0 for i in numbers: total += int(i) return total/ len(numbers)# calculate_stock(numbers) -답:numbers = [10, 20, 30, 40, 50]def calculate_avg(numbers): total_avg = sum(number.. 2025. 6. 13.
[강의] 데이터 전처리와 시각화 4 (완) [키워드]데이터 시각화 툴-plot(), 그래프 종류(line, bar, histogram, pie chart, box, scatter) 1. 데이터 시각화(1)1)데이터 시각화 중요한 이유-바다 오염의 주범이 빨대?-빨대를 사용금지하는 것이 얼마나 효과있을까?-실제 데이터를 살펴보면, 전세계 바다 쓰레기 0.03%가 빨대로 인한 것이고,가장 문제가 되는 것은 46%를 차지하는 어망.-이를 바탕으로 어떤 의사결정을 할 수 있을까?효율/효과 측면에서 우리는 어업활동에서 발생하는 바다쓰레기를 줄이는 방안을 모색해야한다고 분석결과를 전달할 수 있습니다.어쩌면, 종이빨대를 만드는 예산을 어업활동에서 쓰레기가 발생하지 않도록 개선시키는 것에 활용하는 것도 제안할 수 있을 것입니다.즉, 어디에 집중을 하고 어떤 전.. 2025. 6. 11.
[강의] 데이터 전처리와 시각화 3 [키워드]1. pandas 설치 및 설정2. 데이터 전처리 - 컬럼3. 데이터 전처리 - 데이터 확인4. 데이터 전처리 - 데이터 선택 (iloc, loc)5. 데이터 전처리 - 불리언 인덱싱6. 데이터 전처리 - 데이터 병합 (concat, merge)7. 데이터 전처리 - 데이터 집계 (group by, piviot table)8. 데이터 전처리 - 데이터 정렬 1. pandas 1) 설치-vscode에import pandas as pd (없으면 pip install pandas)import seaborn as sns (없으면 pip install seaborn)data = sns.load_dataset('tips')data *pip install openpyxl (엑셀열기) 2) 데이터 불러오기#.. 2025. 6. 11.
[강의] 데이터 전처리와 시각화 2 [키워드]데이터 전처리, Excel vs Pandas 1. 데이터 전처리1) 데이터 전처리Excel → 개발자가 아닌 사람에게 가장 중요한 데이터 툴!컬럼 가공하고.. 조건걸고…내가 원하는 데이터를 보기 위해 하는 모든 활동 = 데이터 전처리2)전처리를 해야하는 이유 3)방법- 방향성을 가지고 할 것!데이터를 통해 무엇을 확인할 것인지?어떤 의사결정을 위해 필요한지?데이터를 통해 무엇을 얻고자 하는지, 그 목적을 달성하기 위해 데이터 전처리가 필요함 4)데이터셋 불러오기-Seaborn이라는 라이브러리에서 불러올 수 있는 내장데이터셋을 가지고 실습을 진행iris 데이터셋: 붓꽃의 꽃잎과 꽃받침의 길이와 너비를 포함한 데이터셋입니다.tips 데이터셋: 음식점에서의 팁과 관련된 정보를 담고 있는 데이터셋입니다.. 2025. 6. 10.
[강의] 데이터 전처리와 시각화 1 - 과제(10m to pandas) https://dataitgirls2.github.io/10minutes2pandas/-필사에 가까운 정리..0.불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as plt1. Object Creation (객체 생성)-pandas는 값을 가지고 있는 리스트를 통해 시리즈를 만들고, 정수로 만들어진 인덱스를 기본값으로 불러올 것.s= pd.Series([1,3,5,np.nan, 6, 8])s -datetime 인덱스와 레이블이 있는 열을 가지고 있는 numpy 배열을 전달하여 데이터 프레임(df)을 만듦dates= pd.date_range(’20130101’, periods=6)datesdf = pd.DataFrame(np.random.. 2025. 6. 10.
[강의] 데이터 전처리와 시각화 1 -실습환경vscode 확장탭에서 jupyter 설치.파일생성- 주피터노트북.ipynb코드입력 -> 파이썬 환경 세팅(버전 클릭) -> 설치 -> 코드실행 터미널을 열고(터미널 단축기 : shift + ctrl + ` ) → pip install pandas 입력 1. 데이터 분석가란?BA , PA , BI , DS , DA … 등비즈니스 분석가주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석합니다.비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원합니다.주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행합니다.프로덕트 분석가제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석합니다.사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제.. 2025. 6. 8.