연습 - Python을 사용하여 텍스트 파일에서 데이터 가져오기

완료됨

Python의 많은 애플리케이션에서 외부 원본의 데이터를 사용해야 합니다. 로켓의 다양한 부품을 추적하는 데이터를 포함하는 Excel 파일이나 달 탐사선에 탐지되는 암석을 읽는 텍스트 파일을 예로 들 수 있습니다. 이 단원에서는 미리 만들어진 Python 함수를 사용하여 텍스트 파일에서 데이터를 읽는 방법을 알아봅니다.

데이터 설정

파일에서 데이터를 읽는 첫 번째 단계는 파일을 가져와 특정 위치에 저장하는 것입니다. Python에는 나중에 이 위치에 액세스하도록 지정합니다. 먼저 Jupyter Notebook 파일이 저장된 위치를 확인합니다. 이 위치는 Python 폴더 또는 바탕 화면일 수 있습니다. 다음으로 이 텍스트 .txt 파일을 저장해야 합니다. Jupyter Notebook 파일과 동일한 위치에 이 파일을 저장하는 것이 중요합니다. 이를 통해 Python에 데이터를 찾을 수 있는 위치를 쉽게 지정할 수 있습니다. 폴더는 아래와 같이 표시됩니다.

파일 구조를 보여 주는 스크린샷

Jupyter Notebook으로 데이터 가져오기

이제 데이터를 저장했으므로 Python에 파일 이름을 알려주는 문자열을 만들어야 합니다.

strPath = "text.txt"

다음에는 open() 함수를 사용하여 Python에서 파일을 가져옵니다. 이제 데이터를 저장하기 위해 fileObject라는 새 변수를 만듭니다.

fileObject = open(strPath)

마지막으로, Python에서 이 fileObject 변수를 읽고 readlines() 함수를 사용하여 Python 함수로 탐색할 수 있는 문자열 목록을 표시하도록 지정합니다. readlines() 함수는 텍스트 파일의 각 줄을 가져와 목록의 항목으로 만듭니다. 나중에 출력할 수 있도록 이 목록을 다른 변수에 저장합니다. 작업을 완료한 후에는 fileObject를 닫는 것도 좋습니다. .close()를 호출하여 이 작업을 수행합니다.

textList = fileObject.readlines()
fileObject.close()

마지막으로 목록을 반복하여 방금 읽은 문자열의 내용을 출력할 수 있습니다.

for line in textList:
    print(line)
First Astronaut on the moon  
Neil Armstrong

위의 예제에서는 Python으로 전체 데이터를 읽어오는 방법을 알려줍니다. 텍스트 파일을 읽고 특정 부분만 살펴볼 수도 있습니다. 이것을 프로그래밍에서 구문 분석이라고 합니다. 방금 가져온 텍스트를 구문 분석하기 위해 줄 단위로 진행하면서 모든 줄을 출력해 보겠습니다. 모든 줄은 목록의 요소이므로 목록의 첫 번째 요소를 확인하여 첫 번째 줄을 가져올 수 있습니다.

firstLine = textList[0]
print(firstLine)
First Astronaut on the moon

텍스트 파일에서 두 번째 줄을 읽으려면 목록에서 두 번째 항목을 가져옵니다.

secondLine = textList[1]
print(secondLine)
Neil Armstrong