전체 글 10

07. 데이터 정제하기(결측치, 이상치)

현장에서 만들어진 실제 데이터는 오류를 포함하고 있기 때문에 분석하기 전에 데이터 정제 과정이 필요하다. 결측치 정제하기¶ 결측치 : 누락된 값, 비어 있는 값 ## 결측치 만들기 In [1]: import pandas as pd import numpy as np In [2]: df = pd.DataFrame({'sex' : ['M', 'F', np.nan, 'M', 'F'], 'score' : [5, 4, 3, 4, np.nan]}) df Out[2]: sex score 0 M 5.0 1 F 4.0 2 NaN 3.0 3 M 4.0 4 F NaN 결측치가 있는 상태에서 연산을 하면 출력 결과도 결측치이다. In [7]:..

6-6. 상황에 따라 다른 데이터를 반환하는 DECODE 함수와 CASE문

DECODE 함수 기준이 되는 데이터를 먼저 지정한 후 해당 데이터 값에 따라 다른 결과 값을 내보내는 함수이다. 조건에 해당하는 값이 없을 때 반환 값을 지정하지 않으면 NULL이 반환된다. CASE문 특정 조건에 따라 반환할 데이터를 설정할 때 사용한다. - 특징 - 1. DECODE 함수와 달리 CASE 문은 각 조건에 사용하는 데이터가 서로 상관없어도 된다. 2. 비교할 기준 데이터를 지정하지 않고 값이 같은 조건 이외의 조건도 사용할 수 있다. 3. DECODE 함수보다 법용성이 더 높다. 4. WHEN, THEN 적은 후 쉼표(,) 하지 않는다. 기준 데이터 없이 조건식만으로 CASE문 사용하기 위 결과에서 알 수 있듯이 CASE문은 각 조건식의 true, false 여부만 검사하므로 기준 데..

Oracle 2022.11.17

6-5. NULL 처리 함수

특정 열의 데이터가 NULL일 경우, 연산 수행을 위해 데이터를 NULL이 아닌 다른 값으로 대체해 주어야 할 때가 종종 발생한다. NVL 함수의 기본 사용법 NVL([NULL인지 여부를 검사할 데이터 또는 열(필수)], [앞으 데이터가 NULL일 경우 반환할 데이터(필수)]) NVL2 함수의 기본 사용법 NVL2([NULL 인지 여부를 검사할 데이터 또는 열], [앞 데이터가 NULL이 아닐 경우], [앞 데이터가 NULL일 경우]) NVL2 함수는 NVL 함수와는 달리 NULL이 아닌 경우에 반환 데이터까지 지정할 수 있으므로 좀 더 다양한 용도로 활용이 가능하다. 근데 실무에서는 NVL을 더 많이 사용하는 듯?

Oracle 2022.11.17

6-4. 자료형을 반환하는 형 변환 함수

숫자형인 사원 번호에 문자열이 500을 더한 결과는 사원번호에 숫자 500을 더한 결과 값으로 출력되었다. 수치 연산이 가능한 이유는 '자동 형 변환'이라고도 불리는 암시적 형 변환(implicit type conversion)이 발생했기 때문이다. 쉽게 말하자면, 숫자로 인식 가능한 문자 데이터가 자동으로 숫자로 바뀐 후 연산이 수행된 것이다. 오라클에서 자료형이 자동으로 변환되는 방식이 아닌 사용자, 즉 우리가 자료형을 직접 지정해 주는 방식을 명시적 형 변환(explicit type conversion)이라고 한다. 종류 설명 TO_CHAR 숫자 또는 날짜 데이터를 문자 데이터로 변환 TO_NUMBER 문자 데이터를 숫자 데이터로 변환 TO_DATE 문자 데이터를 날짜 데이터로 변환 문자를 중심으로..

Oracle 2022.11.16

6-3. 날짜 데이터를 다루는 날짜 함수

연산 설명 날짜 데이터 + 숫자 날짜 데이터보다 숫자만큼 일수 이후의 날짜 날짜 데이터 - 숫자 날짜 데이터보다 숫자만큼 일수 이전의 날짜 날짜 데이터 - 날짜 데이터 두 날짜 데이터 간의 일수 차이 날짜 데이터 + 날짜 데이터 연산 불가, 지원하지 않음 오라클에서 제공하는 날짜 함수 중 가장 대표 함수는 SYSDATE 함수이다. SYSDATE 함수는 별다른 입력 데이터 없이, 오라클 데이터베이스 서버가 놓인 OS(Operating System: 운영체제)의 현재 날짜와 시간을 보여준다. ADD_MONTHS([날짜 데이터(필수), [더할 개월 수(정수)(필수)]) : 특정 날짜에 지정한 개월 수 이후 날짜 데이터 값을 반환 MONTHS_BETWEEN([날짜 데이터1(필수), [날짜 데이터2(필수)]) :..

Oracle 2022.11.16

6-1. 문자 데이터를 가공하는 문자 함수

1. UPPER, LOWER, INITCAP( ) : 대 · 소문자로 바꿔주는 함수 함수 설명 UPPER() 모두 대문자로 변환 LOWER() 모두 소문자로 변환 INITCAP() 첫 글자는 대문자로, 나머지 문자는 소문자로 변환(Capitalize 와 같은 기능) 2. LENGTH( ) : 문자열의 길이를 구해주는 함수 - 한글은 한 문자당 2byte - LENGTHB( ) : 문자열의 바이트 수를 반환해 주는 함수 3. SUBSTR( ) : 문자열 일부를 추출하는 함수 SUBSTR(문자열 데이터, 시작 위치, 추출 길이) SUBSTR(문자열 데이터, 시작 위치) 4. INSTR( ) : 문자열 데이터 안에서 특정 문자 위치를 찾아주는 함수 👇👇👇 INSTR([대상 문자열 데이터(필수)], [위치를 찾..

Oracle 2022.11.09

5. WHERE절과 연산자

5-1. 필요한 데이터만 출력하는 WHERE절 SELECT문으로 데이터를 조회할 때 특정 조건을 기준으로 원하는 행을 출력할 때 사용 5-2. 여러 개 조건식을 사용하는 논리 연산자(AND, OR ) - 비교하는 데이터가 문자열일 경우에는 작은따옴표('')로 묶어 준다. - 테이블 안에 들어있는 문자 또는 문자열 데이터는 대,소문자를 구별하기 때문에 반드시 내용에 맞게 작성한다. 5-3. 연산자 종류와 활용 방법 산술 연산자( +, -, *, /) 비교 연산자 대소 비교 연산자( >, >=,

Oracle 2022.11.08

4. SELECT문의 기본 형식

4-1. 실습용 테이블 살펴보기 사원 정보가 들어 있는 EMP(Employee) 테이블 EMP 테이블 구성 살펴보기 EMP 테이블을 구성하는 열 살펴보기 열 이름 열 의미 데이터 종류 설명 EMPNO 사원 번호 NUMBER(4) 네 자리 숫자 EMP 테이블에서 각 사원의 데이터를 구분할 수 있는 유일한 값을 저장하는 열이며 기본키로 사용한다. ENAME 사원 이름 VARVHAR2(10byte) (가변형 문자열) SCOTT, JONES 등 JOB 사원 직책 VARCHAR2(9byte) (가변형 문자열) NANAGER, CLERK 등 MGR 직속 상관의 사원 번호 NUMBER Manager 의 약어로 현재 행에 해당하는 사원의 상급자의 네 자리 사원 번호를 저장하는 열이다. HIREDATE 입사일 DATE ..

Oracle 2022.11.07

1. 데이터베이스

1-1. 데이터와 데이터베이스, DBMS DBMS(Database Management System) : 데이터베이스 관리 시스템 "여러 목적으로 사용할 데이터의 접근 및 관리 등의 업무를 전담하는 방식" - 데이터 누락 또는 중복 방지 - 응용 프로그램의 서비스 제공과 데이터 관련 작업 효율 증가 1-2. 데이터 모델 : 컴퓨터에 데이터를 저장하는 방식 ex) 계층형, 네트워크형, 관계형, 객체지향형 계층형 데이터 모델 나뭇가지 형태의 트리(tree) 구조를 활용하여 데이터 관련성을 계층별로 나누어 부모 자식 같은관계를 정의하고 데이터를 관리하는 일대다(1:N) 관계 네트워크형 데이터 모델 = 망형 데이터 모델 개체 간 관계를 그래프 구조로 연결 객체 지향형 데이터 모델 데이터를 독립된 객체로 구성하고 ..

Oracle 2022.11.03