본문 바로가기

파이썬

단어 빈도수 분석 - 텍스트 파일에서 단어의 빈도수를 분석

반응형

1. 제목 및 설명:


제목: 단어 빈도수 분석 프로그램
설명: 이 프로그램은 텍스트 파일에서 단어의 빈도수를 분석하는 파이썬 예제입니다.

2. 코딩시 주의 할 점:

텍스트 파일을 읽을 때 파일 경로와 인코딩에 주의해야 합니다.
문자열 처리와 단어 분리를 적절하게 수행해야 합니다.


3. 코딩에 나오는 명령어 설명:

open(): 파일을 열기 위한 함수로, 파일 경로와 모드를 지정합니다.
read(): 파일 내용을 읽어옵니다.
split(): 문자열을 공백을 기준으로 분리하여 리스트로 반환합니다.
lower(): 문자열을 소문자로 변환합니다.
strip(): 문자열의 양쪽 공백을 제거합니다.
dict(): 빈 딕셔너리를 생성합니다.
for 반복문: 리스트의 각 요소를 반복적으로 처리합니다.
if 문: 조건문으로 특정 조건이 참일 때 코드 블록을 실행합니다.


4. 실행 방법:

파이썬을 설치하지 않았다면 Python 공식 웹 사이트에서 다운로드하고 설치하세요.
텍스트 파일을 준비하고 파일 경로를 코드에 지정하세요.
아래의 파이썬 코드를 텍스트 편집기에 복사하여 .py 파일로 저장하세요.
명령 프롬프트 또는 터미널을 열고 해당 디렉토리로 이동한 후, 다음 명령을 실행하세요:
python 파일이름.py


5. 파이썬 코드:

try:
    # 텍스트 파일 경로 (본인의 파일 경로로 변경하세요)
    file_path = "sample.txt"
    
    # 파일 열기
    with open(file_path, "r", encoding="utf-8") as file:
        # 파일 내용 읽기
        text = file.read()
        
        # 문자열을 소문자로 변환하고 공백을 기준으로 분리
        words = text.lower().split()
        
        # 단어 빈도수를 저장할 딕셔너리 생성
        word_count = dict()
        
        # 단어 빈도수 계산
        for word in words:
            # 양쪽 공백 제거
            word = word.strip()
            if word in word_count:
                word_count[word] += 1
            else:
                word_count[word] = 1
        
        # 결과 출력
        for word, count in word_count.items():
            print(f"{word}: {count}번 출현")
except Exception as e:
    print("오류 발생:", e)

반응형