728x90
반응형
파이썬을 이용해서 부동산 관련 문서를 정리하는 코드의 예제
import os
import csv
def document_organizer(dir_path):
# 디렉토리 경로를 인자로 받음
# 해당 경로에 있는 모든 파일을 탐색
for filename in os.listdir(dir_path):
if filename.endswith('.csv'):
# .csv 파일만 정리
file_path = os.path.join(dir_path, filename)
with open(file_path) as f:
reader = csv.reader(f)
headers = next(reader)
# 헤더(첫 번째 줄)를 읽어옴
organized_rows = []
# 정리할 데이터를 저장할 리스트
for row in reader:
organized_row = {}
# 각 데이터를 저장할 딕셔너리
for i, header in enumerate(headers):
organized_row[header] = row[i]
organized_rows.append(organized_row)
# 정리한 데이터를 organized_rows에 추가
# 정리한 데이터를 새로운 파일로 저장
organized_file_path = os.path.join(dir_path, 'organized_' + filename)
with open(organized_file_path, 'w', newline='') as f:
writer = csv.DictWriter(f, fieldnames=headers)
writer.writeheader()
writer.writerows(organized_rows)
if __name__ == '__main__':
document_organizer('real_estate_documents')
이 코드는 부동산 관련 문서가 저장되는 디렉터리 경로를 인수로 사용하고 디렉터리의 모든 .csv 파일을 반복합니다. 각 .csv 파일의 헤더(첫 줄)를 읽고 사전 목록에 데이터를 저장합니다. 그런 다음 구성된 데이터는 동일한 헤더와 원래 파일 이름에 "organized_" 접두사가 추가된 새 파일에 저장됩니다.
728x90
반응형
'파이썬' 카테고리의 다른 글
데이터프레임 특정값을 Nan으로 변경하기 (0) | 2023.02.09 |
---|---|
PDF 문서에서 테이블을 추출하여 판다 데이터 프레임으로 변환 (0) | 2023.02.09 |
파이썬에서 엑셀로 저장할 때 보기좋게 정리하는 코드 (0) | 2023.02.09 |
파이썬으로 부동산고객관리 시스템 코드 (0) | 2023.02.09 |
데이터프레임을 엑셀파일로 저장시 시간이 지나면 엑셀파일을 열지 못하도록하는 파이썬 코드 (0) | 2023.02.09 |