데이터분석

[데이터 분석] chapter3. 데이터 분석을 위한 파일 입출력

wse46 2024. 10. 13. 22:48

데이터 분석 프로그래밍 언어 : 파이썬, R
프로그래밍 환경 : 구글 Colab


[개요1] 파일 업로드 함수 호출하기

from google.colab import files
#파일 업로드 함수 호출하기
f = files.upload( )

 
[개요2] 업로드된 csv파일 한 행씩 읽어오기

import csv
f = open('읽어올파일.csv', 'r', encoding = 'cp949')
rdr = csv.reader(f)
#반복문으로 한 행씩 출력하기
for line in rdr:
  print(line)
f.close( )

 
[개요3] csv파일에 데이터를 작성하여 저장

import csv
f = open('저장할파일.csv', 'w', encoding='cp949', newline='')
#'w'->'a' 기존 내용에 추가해서 저장
#CSV 파일 작성할 준비하기
wr = csv.writer(f)
#데이터를 한 행씩 작성하기
wr.writerow(['ID', '이름', '상징색', '취미', '특징'])

 
[개요4] 엑셀파일 불러와서 인쇄
- print(sheet이름['셀위치'].value)

#openpyxl 라이브러리 설치하기
!pip install openpyxl
#openpyxl 라이브러리 가져오기
import openpyxl
#엑셀파일 읽어오기
wb = openpyxl.load_workbook('읽어올파일.xlsx')
print(wb.sheetnames) #sheet이름 인쇄 -> Sheet1
sheet1 = wb['Sheet1'] #엑셀의 Sheet1 배정
print(sheet1['A1'].value) #sheet1의 A1 값 출력 -> 10

 
[개요5] 엑셀파일의 Sheet에 이름을 부여

wb = openpyxl.Workbook( )
#새 워크시트 생성하기
wb.create_sheet('Sheet2')
sheet2 = wb['Sheet2']
sheet2.title = '인기도 조사'
print(wb.sheetnames) #['Sheet', '인기도 조사']
wb.save('새로저장할파일.xlsx')

 
[개요6] 파일 업로드 함수 호출하기

from google.colab import files
#파일 업로드 함수 호출하기
k1 = files.upload( )

 


중요 실습 코드
 
# 3-1 files 라이브러리
 

from google.colab import files

#파일 업로드 함수 호출하기
f = files.upload( )

 
 
# 3-2 CSV 파일 불러오기

f = open('characterscse.csv', 'r', encoding = 'cp949')

 
 
# 3-3 CSV 파일 읽기

f = open('characters약자.csv', 'r', encoding = 'cp949')
import csv
rdr = csv.reader(f)

#반복문으로 한 행씩 출력하기
for line in rdr:
  print(line)

 
 
# 3-4 특정 열 출력

f = open('characters약자 .csv', 'r', encoding =
'cp949')
rdr = csv.reader(f)
#두 번째 열을 반복문으로 한 행씩 출력하기
for line in rdr:
  print(line[1])

 
 
# 3-5 자원 반환

f.close( )

 
 
# 3-6 CSV 파일 작성

#csv 라이브러리 가져오기
import csv

#CSV 파일 불러오기
f = open('write약자.csv', 'w', encoding='cp949',
newline='')

#CSV 파일 작성할 준비하기
wr = csv.writer(f)

#데이터를 한 행씩 작성하기
wr.writerow(['ID', '이름', '상징색', '취미', '특징'])
wr.writerow(['001', '뽀로로', '파랑색', '낚시', '펭귄'])
wr.writerow(['002', '에디', '주황색', '과학실험',
'사막여우'])
wr.writerow(['003', '크롱', '초록색', '눈싸움', '공룡'])
wr.writerow(['004', '루피', '분홍색', '요리', '비버'])
wr.writerow(['005', '패티', '보라색', '운동', '펭귄'])

#f 변수의 자원 반환하기
f.close( )

 
 
# 3-7 CSV 파일에 데이터 추가

f = open('write약자.csv', 'a', encoding='cp949', newline='')
wr = csv.writer(f)
wr.writerow(['006', ' 포비', ' 흰색', '춤', '북극곰'])

#f 변수의 자원 반환하기
f.close( )

 
– open( ) 함수의 두 번째 인자로 a(추가하기)를 사용.
– writerow( ) 함수로 내용을 작성하면 wr의 맨 끝에 추가됨.
– 데이터를 추가하는 동작이 끝나면 close( ) 함수를 호출하여 객체의 자원을 반환.
 
 
# 3-8 엑셀 파일 업로드

from google.colab import files
f = files.upload( )

 
 
# 3-9 

#openpyxl 라이브러리 설치하기
!pip install openpyxl
#openpyxl 라이브러리 가져오기
import openpyxl

wb = openpyxl.load_workbook('characters약자.xlsx')

 
 
# 3-10 특정 열 출력

print(wb.sheetnames)

– sheetnames 속성으로 wb 변수에 담긴 엑셀 파일의 모든 워크시트 이름을 출력.
 
 
# 3-11 특정 위치의 데이터 읽기

sheet1 = wb['Sheet1']
print(sheet1['A1'].value)

 
– Sheet1 워크시트를 변수 sheet1에 따로 담기
– 변수 sheet1에 담긴 워크시트의 A1 셀에 저장된 값을 불러와 print( ) 함수로 출력.
 
 
# 3-12 새 워크북 생성

wb = openpyxl.Workbook( )

 
– 엑셀 파일에는 최소 1개의 워크시트가 존재해야 하므로 wb 안에 워크시트 Sheet가 자동 생성.
 
 
# 3-13 새 워크시크 생성

#새 워크시트 생성하기
wb.create_sheet('Sheet2')
#시트 이름 출력하기
print(wb.sheetnames)

 
–함수 create_sheet( )를 사용하여 워크북 wb에 새 워크시트 Sheet2를 생성.
–객체 wb의 sheetnames 속성을 출력하여 현재 워크시트 목록을 확인.
 
 
# 3-14 

sheet1 = wb['Sheet']
sheet2 = wb['Sheet2’]
sheet1.title = '캐릭터 명단'
sheet2.title = '인기도 조사’
print(wb.sheetnames)

 
– 두 워크시트 Sheet와 Sheet2를 각각 변수 sheet1과 sheet2에 담기.
– title 속성을 변경 후, 현재 워크시트 목록을 출력하여 변경된 워크시트 이름을 확인.
 
 
# 3-15 워크시트 이름 변경

sheet2['B1'] = '인기도 조사결과'
print(sheet2['B1'].value)

 
 
# 3-16 워크시트 복제

copysheet = wb.copy_worksheet(sheet2)
print(wb.sheetnames)
#복제 시트의 이름 변경하기
copysheet.title = 'copy'
print(wb.sheetnames)
print(copysheet['B1'].value)

 
– 변수 sheet2를 copy_worksheet( ) 함수의 인자로 넣고 함수가 반환하는 워크시트는 변수 copysheet에 담기.
– 시트 이름을 출력하여 확인.
– 변수 copysheet에 담긴 워크시트의 title 속성을 copy로 변경.
– 다시 시트 이름을 출력해 보면 변수 copysheet에 담긴 워크시트 이름이 copy.
– 워크시트 내용까지 복제되었는지 확인하기 위하여 value 함수로 B1 셀의 값을 출력.
 
 
# 3-17 워크시트 삭제

del wb['인기도 조사']
print(wb.sheetnames)

 
– 워크북 안에 워크시트가 두 개로 줄었고 변수 sheet2는 빈 그릇으로 남음.
 
 
# 3-18 엑셀 파일 저장

wb.save('complete약자.xlsx')

 
– 구글 Colab 탐색 창의 디렉토리에‘complete약자.xlsx’ 파일이 생성됨.