본문 바로가기

분류 전체보기

(35)
[Logstash] 설치, 동작방식, 필터예시(grok, mutate, ruby, jdbc, file) Logstash : logstash는 실시간 파이프라인 기능을 지원하는 데이터 엔진 오픈소스이다. 1. Logstash 동작방식 : Logstash의 파이프라인은 input -> filters -> output 세단계로 데이터를 처리한다 input : logstash가 읽을 데이터를 넣는 부분 file : 파일 시스템의 파일을 읽어온다 (해당 파일 권한 확인 666 이상) filter : 데이터를 가공하는 부분 (데이터 파싱, 문자열 가공 등) grok : 데이터 파싱을 지원하는 plugin mutate : field(=grouping하여 변수에 저장한 것)를 재가공하는 plugin date : datetime을 가공(pasing, formating 지원)하는 plugin ruby : ruby 언어를 통..
[Eclipse] 이클립스 자주 쓰이는 유용한 단축키 이클립스에는 편리한 단축키들이 많이 있는데 이것을 아는 것과 모르는 것의 일효율 차이는 매우크다. 이중에 자주 쓰이는 단축키들에 대해 알아보자. 1. 코드 자동완성 (컨트롤 + space) 2. 포맷팅, 자동 들여쓰기 맞춤 (컨트롤 + shift + f) 3. 코드 복사 (컨트롤 + 알트 + 아래 방향키) 4. 열 선택모드 (한번에 원하는 부분만 지우는게 가능) (Alt + Shift + a) 알트+ 쉬프트 + a 를 누르면 마우스 커서가 십자가로 바뀌게 되는데 이때 쉬프트를 이용해 원하는 부분을 드래그한다. 알트 + 쉬프트 + a 를 다시 누르면 열 선택 모드를 종료할 수 있다. 5. 원하는 열 지우기 (컨트롤 + d) : 커서가 있는 한줄 혹은 드래그되어 있는 모든 부분의 코드를 지운다.
[Eclipse] 코드 자동완성 문구 추가하기 (이클립스 템플릿 추가) 이클립스에는 지정되어 있는 코드들의 일부분만 쓰면 나머지를 자동완성 해주는 기능이 있다. (컨트롤 + 스페이스바) 예를 들면, syso만 쓰고 '컨트롤 + 스페이스'를 누르면 System.out.println()으로 자동완성된다. 이때, 이클립스의 지정된 코드 외에 사용자가 원하는 문구를 자동완성 기능에 추가하는 방법을 알아보자.
[R 기초] 리스트 (List) - 리스트 (List) : List는 각기 다른 타입의 컴포넌트들을 포함한 벡터이다. 1. List Slicing : x[2]로 인덱싱하는 경우 리스트의 두번째 인자인 c("aa", "bb", "cc", "dd", "ee") 가 출력되긴 하지만 []를 두번 접근했다는 의미로 [[1]]가 출력된 것을 볼 수있다. 2. Member Reference : 리스트의 멤버에 직접 접근하기 위해서는 []를 2번 사용해주어야 한다. 이 때에는 [[]]없이 바로 결과가 출력되는 것을 볼 수 있다. **List Slicing VS Member Reference 따라서 리스트 2번째 인자인 벡터의 첫번째 인자를 출력하는 경우에 List Slicing의 문제점이 들어난다. x[2][1]로는 2차원 인덱싱이 불가능하다. 3...
[R 기초] 행렬 (Matrix) - 행렬(Matrix) : R에서 행렬(matrix)는 2차원 벡터를 의미한다. 인덱스를 통해 접근가능하며 행 또는 열의 인덱스를 비워두면 전체를 의미한다. 앞에서 배운 Numeric Index를 통해 원하는 열만 뽑아내는 것도 가능하다. dimnames() 함수를 이용해 각 행열의 이름을 부여할 수 있다. 부여한 이름으로 인덱싱도 가능하다. 1. Transpose (전치행렬) : t()함수를 이용하면 행과 열을 바꾼 전치행렬을 얻을 수 있다. 2. Combining Matrices cbind() 함수를 이용하면 컬럼끼리(가로로) 두개의 matrix를 결합하는 것이 가능하다. rbind() 함수를 이용하면 로우끼리(세로로) 두개의 matrix를 결합하는 것이 가능하다. 3. Deconstruction (..
[R 기초] 벡터 (Vector) - 벡터(Vector) : 벡터란 같은 데이터 타입의 나열을 말한다. 벡터 안의 값들을 요소(Components 또는 members)라 한다. R에서 벡터는 c() 함수를 이용해 정의한다. 1. 벡터 결합하기 (Combining Vectors) : 여러개의 벡터를 하나로 결합하는 것이 가능하다. -> 여기서 벡터는 반드시 문자열이어야 한다는 규칙때문에 (2,3,5)가 문자열로 변환된것을 확인 할 수 있다. 2. 벡터 연산하기 (Vector Arithmetics) 벡터와 상수의 산술 연산시 각 각의 components들에 해당 연산을 수행한다. 벡터와 벡터의 산술 연산 시 같은 자리의 components들 끼리 연산을 수행한다. **Recycling Rule(재활용 규칙) : 길이가 다른 두개의 벡터 연산..
[R 기초] 기본 데이터 타입 (Basic Data Types) 1. nemeric : 10진수 타입 2. integer : 정수 타입을 생성하기 위해서는 as.integer() 함수를 사용해야한다. 숫자에 L을 붙여 변수에 할당하면 integer가 된다. 3. complex : i를 이용하여 복소수를 정의한다. 4. logical : 변수들 사이의 논리를 비교하기 위해서 사용한다. R의 논리연산자 ( & : AND, | : OR, ! : NOT) 5. character : 문자열 변수, as.character() 함수를 이용해 문자열로 변환 가능하다. **Reference : http://www.r-tutor.com/r-introduction/basic-data-types
[파이썬 기초] 인스턴스 메서드, 클래스 메서드, 스태틱 메서드 구분하기 메서드의 종류를 모르면 앞에 글을 먼저 읽고 보세요. *메서드의 종류 : https://mumala.tistory.com/19 1. 클래스와 객체(인스턴스)의 네임스페이스 : 먼저 클래스와 객체(인스턴스)의 저장공간(네임스페이스, namesapce)에 대해 이해하자 위 그림처럼 객체와 클래스에는 각각 네임스페이스가 있으며 객체가 클래스를 상속받는 구조이다. 즉, 객체를 통해 변수나 함수를 호출하는 경우 다음과 같은 순서로 찾게된다. 1. 객체 (인스턴스) 영역 2. 클래스 영역 3. 전역 영역 2. 메서드의 종류 구분하기 : 위에서 배운 네임스페이스 개념을 통해 메서드의 종류를 구별해보자. 3개의 메서드 모두 객체를 통해 함수를 호출하는 것이 가능하다. 인스턴스 메서드만 불가능하다. 그 이유에 대해 알아..