-
Pandas 2.0: 데이터 과학자를 위한 새로운 기능은 무엇입니까?IT 일반 2023. 7. 3. 22:47반응형
데이터 과학자를 위한 Pandas 2.0의 새로운 기능은 무엇입니까?
데이터 분석을 위한 강력한 Python 패키지를 Pandas라고 합니다. 데이터 과학자와 분석가는 이를 사용하여 전 세계의 데이터를 수정, 정제 및 분석합니다. Pandas 2.0은 2020년에 게시되었으며 다양한 새로운 기능 과 개선 사항이 포함되었습니다.
DataFrame의 추가는 Pandas 2.0의 가장 중요한 개선 사항 중 하나입니다. 데이터 프레임 개체입니다. DataFrame 개체는 기존 DataFrame 개체를 보다 강력하고 적응 가능한 개체로 대체합니다. 복잡한 데이터 분석 작업의 실행을 용이하게 하고 더 넓은 범위의 데이터 형식을 지원합니다.
Series.Series 개체는 또 다른 중요한 개발 인 Pandas 2.0에 추가되었습니다 . 단일 종류의 데이터는 Series.Series 개체라는 1차원 배열에 저장할 수 있습니다. NumPy 배열과 비슷하지만 데이터 처리에 더 적합하도록 여러 가지 추가 기능이 함께 제공됩니다.
또한 Pandas 2.0에는 다음과 같은 다양한 업데이트 및 추가 기능이 포함되어 있습니다.
Pandas 2.0은 많은 새로운 기능과 향상된 기능을 추가하는 중요한 업데이트입니다. 데이터 분석을 위해 최첨단 기술을 사용하려는 모든 데이터 과학자 또는 분석가는 이를 가지고 있어야 합니다.
다음은 데이터 과학자를 위한 Pandas 2.0 활용의 몇 가지 특별한 이점입니다.
- 생산성 향상: Pandas 2.0의 새로운 기능과 개선 사항은 데이터 과학자의 성과를 높일 수 있습니다 . 예를 들어, 새로운 DataFrame 개체와 플로팅 API를 사용하면 데이터를 보다 쉽게 볼 수 있고 복잡한 데이터 분석 작업을 수행할 수 있습니다.
- 정확도 향상 : Pandas 2.0의 새로운 기능과 향상된 기능은 데이터 과학자가 분석 정확도를 높이는 데 도움이 될 수 있습니다. 예를 들어, 새로운 시계열 API를 사용하면 시계열 데이터 작업이 더 간편해지며 새로운 성능 향상을 통해 데이터 과학자는 더 짧은 시간에 더 정확한 결론을 내릴 수 있습니다.
- 향상된 적응성: Pandas 2.0의 업그레이드 및 새로운 기능은 분석을 수행하는 동안 데이터 과학자에게 더 많은 적응성을 제공할 수 있습니다. 예를 들어 새로운 차트 API를 사용하면 다양한 방식으로 데이터를 더 쉽게 볼 수 있으며 새로운 Series.Series 개체는 단일 종류의 데이터를 보유하는 데 사용할 수 있습니다.
다음은 Pandas 2.0 설치를 위한 샘플 코드입니다.
import pandas as pd # Install Pandas 2.0 pip install pandas==2.0 # Check the version of Pandas print(pd.__version__) # See the list of changed features in Pandas 2.0 # https://pandas.pydata.org/docs/dev/whatsnew/v2.0.0.html
pandas 라이브러리 는 먼저 이 코드에서 pd 로 가져옵니다 . 그런 다음 pip 패키지 관리자를 사용하여 Pandas 2.0을 설치합니다. 그러면 현재 설치된 Pandas 버전이 인쇄됩니다. 그러면 Pandas 2.0의 새로운 기능 목록이 인쇄됩니다.
이 코드를 실행하려면 Python과 pip 패키지 관리자가 설치되어 있어야 합니다 . Python 웹 사이트 https://www.python.org/ 의 지침에 따라 Python 및 pip를 설치합니다 .
코드를 .py 파일로 저장한 다음 Python 및 pip가 설치되면 명령줄에서 프로그램을 실행하여 코드를 실행할 수 있습니다. 예를 들어 명령줄에 다음 명령을 입력하여 코드를 install_pandas_2.0.py 로 저장하면 코드를 실행할 수 있습니다.
python install_pandas_2.0.py
이렇게 하면 Pandas 2.0이 설정되고 변경된 기능 목록이 게시됩니다.
import pandas as pd # Create a DataFrame df = pd.DataFrame({ "Name": ["John Doe", "Jane Doe", "John Smith"], "Age": [30, 25, 40], "Salary": [50000, 40000, 60000] }) # Print the DataFrame print(df) # Use the `to_html()` method to save the DataFrame to an HTML file df.to_html("df.html") # Use the `to_sql()` method to save the DataFrame to a SQL table df.to_sql("df", "my_database", if_exists="replace") # Use the `dt` property to get the datetime information from the `Date` column df["Date"].dt.floor() # Use the `dt.floor()` method to get the floor of the datetime information from the `Date` column df["Date"].dt.floor("D") # Use the `to_string()` method to print the DataFrame to a string df.to_string() # Use the `to_string()` method to print the DataFrame to a string, with the index and columns df.to_string(index=True, columns=["Name", "Age", "Salary"])
이 코드에서는 Pandas 2.0의 몇 가지 새로운 기능을 사용하는 방법을 보여줍니다. 수정된 기능에 대한 자세한 내용은 Pandas 2.0의 새로운 기능: 변경 사항 페이지( https://pandas.pydata.org/docs/dev/whatsnew/v2.0.0.html 문서)를 참조하세요.
데이터 과학자나 분석가로 일하는 경우 Pandas 2.0을 살펴보기를 촉구합니다. 작업을 보다 효율적이고 정확하며 적응 가능하게 만들 수 있는 많은 새로운 기능과 향상된 기능을 포함하는 중요한 업그레이드입니다.
반응형