전체 글 92

Oracle 파티션 테이블과 파티션 인덱스 (DELETE 튜닝)

Oracle Partition DELETE 튜닝 정리 DELETE FROM INFO_TABLE WHERE TIME < '20220101' (INFO_TABLE은 파티션 키는 TIME이며 PK는 VALUE1+TIME , TIME만 으로 구성된 인덱스도 존재) 위의 테이블에서 테이블과 인덱스를 실시간으로 관리하는 것은 많은 시간을 필요로 한다. 인덱스를 Drop 했다가 재생성하는 방법도 모든 인덱스를 재생성해야 하므로 시간이 많이 소요된다. * Delete의 과정 1. 레코드 삭제 2. 테이블 레코드 삭제에 대한 Undo Logging 3. 테이블 레코드 삭제에 대한 Redo Logging 4. 인덱스 삭제 5. 인덱스 레코드 삭제에 대한 Undo Logging 6. 인덱스 레코드 삭제에 대한 Redo Lo..

C.S/DB 2022.07.06

Oracle 파티션 테이블과 파티션 인덱스 (UPDATE 튜닝)

Oracle Partition UPDATE 튜닝 정리 인덱스가 DML 성능에 큰 영향을 미치므로 대량 데이터를 입력/수정/삭제 시에는 인덱스를 DROP하거나 Unusable 상태로 변경하고 작업하는 방법을 많이 활용한다 (전체의 5%이상일시) UPDATE INFO_TABLE SET VALUE2='CHANGE' WHERE VALUE1 = 'Y' AND TIME '20211130' (INFO_TABLE은 파티션 키는 TIME 이며 PK 는 VALUE1+TIME , TIME만 으로 구성된 인덱스도 존재) 위와 같은 쿼리를 수행할시 변경해야될 레코드가 전체의 5%이상이라고 할시 인덱스와 테이블을 모두 수정하는데에 많은 시간이 필요하다. 만약 위의 경우에서 테이블이 파티..

C.S/DB 2022.07.06

Oracle 파티션 테이블과 파티션 인덱스

Oracle Partition (1) 파티셔닝 : 테이블 또는 인덱스 데이터를 특정 컬럼에 따라 별도 세그먼트에 나눠서 저장 1. 관리적 측면 장점 : 파티션 단위 백업,추가,삭제,변경 -> 가용성 향상 2. 성능적 측면 장점 : 파티션 단위 조회 및 DML 경합 또는 부하 분산 * 파티션 Pruning SQL 하드파싱이나 실행시점에 조건절을 분석하여 불필요한 부분의 제거 SELECT * FROM INFO_TABLE WHERE TIME >'20210101' AND TIME < '20220101' 위의 SQL INFO_TABLE이 전체 3000만건 중 해당 기간동안의 데이터가 1000만건이 조회된다고 하면 인덱스로 랜덤엑세스하는것 보다 테이블엑세스의 성능이 나을 수 있다. 그러나 위의 Partitioned..

C.S/DB 2022.07.05

Scikit-learn을 활용한 데이터 처리와 성능 평가

1. 데이터 전처리후(Pandas dataTable) Target Value 분리import numpy as npimport pandas as pd# target 확인target = 'Target_YVALUE'# 데이터 분리x = data.drop(target, axis=1)y = data[target]2) Training, Test 데이터 분리# scikit-learn을 사용한 데이터 분리from sklearn.model_selection import train_test_split# 8:2으로 분리x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=2022) 3. Traing Set을 활용한 간단한 회..

Tools/ETC 2022.05.13

Collection과 람다식을 활용한 데이터 처리 정리 - 1

# 다중 조건 정렬 1. 데이터 입력 List list = new ArrayList(); Student s1 = new Student(11001244, "아무개", "서울시 금천구"); Student s2 = new Student(25109435, "김김김", "서울시 중랑구"); Student s3 = new Student(11005338, "사이다", "서울시 은평구"); list.add(s1); list.add(s2); list.add(s3); 2. 모두 오름차순 정렬 list.sort(Comparator.comparing(Student::getNum).thenComparing(Student::getName) .thenComparing(Student::getAddress)); 3. 이름만 내림차순 ..

HTTP 캐시

HTTP 캐시 반복된 요청에 대해서 리소스를 다시 다운로드 받지 않도록 브라우저 스토리지에 저장된 데이터를 사용하도록 하는 기법 캐시를 저장하는 시간안에 다시 같은 요청이 올 시 저장된 데이터를 사용함 데이터 사용량을 줄이고 데이터 전송 속도를 높일 수 있음 캐시 시간이 초과되면 다시 데이터를 보내주고 캐시 유효시간이 갱신되고 다시 캐시시간이 조회된다. 캐시를 갱신하는 기준이 필요함 검증 헤더와 조건부 요청 캐시가 시간초과과 되었을 시라도 데이터가 변경되지 않을 수 있음 클라이언트와 서버의 데이터가 일치한다는 사실을 확인 할 수 있는 방법이 필요함 1) Last Modifed 1. 클라이언트의 리소스 요청에 따라 서버측에서 Last Modified : UTC (20201112010101) 이라고 보냄 2..

C.S/WEB 2021.03.03

Kafka 동작 원리

1. Pub - Sub 모델 실제 메세지의 송신과 수신이 분리되어 있으며 카프카 큐에 데이터를 저장하는 Kafka Producer , 이를 읽어오는 Kafka Consumer로 분리 되어 Client API를 제공 2. Zookeeper - 분산 코디네이터 서비스 - Kafka는 Zookeeper를 활용하여 데이터 분산 처리 - 각 서버의 상태와 연결, 환경 ,구성 ,위치 , 정보 등 관리데이터를 저장하기 위해 설계 - 디렉토리와 파일처럼 노드내에 데이터를 가지고 있으며 주키퍼 네임스페이스 노드를 가지고 있음 - 클러스터를 구성하는 서버들끼리 공유되는 데이터를 유지하거나 어떤 연산을 조율하기 위해 사용 - 서버 모니터링 가능 - 각 디렉터리 노드를 Znode라고 하며 , 영구노드와 임시노드,시퀀스 노드로..

Tools/KAFKA 2021.03.02

DataBase 정규화

데이터베이스 정규화 1. 불필요한 데이터 삭제 2. 삽입, 수정 ,삭제시 이상 현상 방지 제 1 정규화 - 한속성이 단하나의 값만 존재 1) 다가 속성 이름 번호 (PK)고객번호 홍길동 1 1 홍길동 2 1 - 고객 번호를 안다고 해도 이름과 번호를 알 수 없다. - 번호를 PK로 바꾸던가 인조키를 만들어준다. 이름 고객번호(PK) 홍길동 1 번호(PK) 고객번호(FK) 1 1 2 1 2) 복합 속성 사용 고객번호(PK) 이름 주민번호 100 홍 길동 990303 - 하나의 컬럼에 여러개의 정보가 들어있음 이름 (성 +이름) - 컬럼을 분리한다. - 상황에 따라 사용한다. 고객번호(PK) 성 이름 주민번호 100 홍 길동 930909 3) 유사속성 반복 주문번호1 상품1 주문번호2 상품2 1 의자 2 책..

C.S/DB 2021.02.28

DB 트랜잭션의 정의, 특징

데이터베이스 트랜잭션 데이터베이스가 한번에 실행 되어야하는 논리적 연산의 집함 상호작용의 단위로써 성공과 실패가 분명하며 , 트랜잭션간에 상호 독립적이며, 일관되고 믿을 수 있는 시스템을 의미한다. 트랜잭션의 특징 (ACID) 1. 원자성 , Atomicity - 트랜잭션의 작업들이 진행중에 중간에 중단되지 않는것을 보장 ex) 자금 이체시 보내기만 성공하고 받는 것은 실패하는 경우는 없다. 2. 일관성, Consistency - 데이터베이스가 트랜잭션 이후에 기존의 데이터 베이스의 상태가 변경되거나 트랜잭션에 대한 데이터만 기존 데이터의 기준에 위배하는 다른 형식의 데이터를 가지고 있어서는 안된다. ex) 모든 계좌는 잔금이 1원 이상 남아있어야 한다는 데이터베이스에서 자금 이체후 잔금이 0원이 될 수..

C.S/DB 2021.02.28

스프링 AOP 적용 예제

이전글 : 스프링 AOP 기본 동작 원리 : https://chalchichi.tistory.com/41 스프링 AOP 기본 동작 원리 스프링 AOP - OOP를 보완하기 위해 ASPECT를 모듈화 할 수 있는 프로그래밍 기법 구성요소 1. Aspect : 묶어 놓은 모듈 2. Target : 적용이 되는 대상 3. Advice : Aspect 안의 기능 4. Join Point : 적용 시점 5... chalchichi.tistory.com 1. 스프링 AOP 메이븐 의존성을 추가한다. org.springframework.boot spring-boot-starter-aop 2. 어노테이션 기반으로 실행예정이므로 어노테이션을 만들어준다. @Retention(RetentionPolicy.CLASS) @Ta..

Tools/Spring 2021.02.28