본문 바로가기

데이터추출2

[Pandas] 데이터 분석의 기초 Pandas module - 2 1. 조건에 맞는 데이터 조회 행과 열에 대한 정보를 통해 단 하나의 데이터를 조회할 수 있다면 조건을 통해 조건을 만족하는 모든 데이터를 조회할 수도 있습니다. (df = pd.DataFrame())  위와 같은 데이터프레임이 있다고 할 때, 국어 점수가 70점 이상인 데이터만 조회해서 출력하려면  'df['국어'] 이 70 이상 (>=) 인 조건을 df[] 내에서 찾겠다' 라는 뜻입니다.   이렇게 두개의 조건도 사용가능합니다. 즉, 다양한 조건을 결합해서 조회할 수도 있습니다.  2. 데이터 프레임 슬라이싱 (loc)   위와 같은 데이터가 있다고 했을 때, japan 행 부터 usa 행 까지의 데이터를 슬라이싱을 통해서 출력할 수 있습니다.  3. 데이터 프레임 슬라이싱 (iloc) 아래와 같이 .. 2024. 11. 29.
[Pandas] 데이터 분석의 기초 Pandas module 1. pandas 패키지 불러오기 2. Series 데이터  Series 데이터란 Numpy array 가 보강된  형태의 Data와 index를 가지고 있는 pandas의 데이터 형식입니다.  Series 데이터를 만들기 위해서는 값과 인덱스를 부여해주어야 합니다. 3. DataFrame에서 특정 컬럼 조회 데이터프레임의 컬럼 이름을 사용하면 특정 칼럼을 조회할 수 있습니다. 컬럼 하나를 선택할 경우, pandas의 Series 형태로 반환됩니다.  df = pd.DataFrame({'국어' : [80, 90, 100]...}) 이 있다고 했을 경우, 아래와 같이 한 컬럼을 검색할 수 있다. 4. DataFrame에 새로운 컬럼 추가 데이터프레임에 값을 지정해주어 새로운 칼럼을 추가할 수 있습니다. d.. 2024. 11. 27.