블로그 이미지
Terapi

calendar

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

'A.I./SVM'에 해당되는 글 1

  1. 2008.12.21 SVM 정리(2)
2008.12.21 19:28 A.I./SVM

SVM의 학습기법

교사학습(Supervised Learning )기법의 한 종류로써 교사학습은 훈련과 예측 2단계과정을 거친다.

훈련단계에서는 특징값에 대한 목표값(에러범위 조정값을 설정하여 SVM분류기의 입력값으로 사용하면 훈련모델을 생성한다. 이때의 특징값은 수치적인 형태로 정량화된 값을 의미한다. 예측 단계에서도 SVM  분류기의 입력값은 훈련 단계에서의 입력 값과 동일하다.

(사용자 구매 이력 및 선호도 기반 의상 추천에 관한 연구 ,세종대학원,강한훈)


커널함수

원래 데이터를 고차원 공간으로 사상시킴으로써 특정공간내에 선형으로 분리가능한입력데이터셋을 만든다

커널함수를 선택하는것은 문제에 따라 다르며, SVM 을 적용하는데 있어서 가장 중요한 요소이다.일반적인 커널함수의 예로는 다항식 커널(Polynomail)과 가우시안 RBF( Gaussian radial basis function)를 들수있다.

(항목 유사도를 고려한 트랜잭션 클러스터링, 한양대학교, 이상욱)


군집화(Clustering)

주어진 객체들 중에서 유사한것들을 몇몇 집단으로 그룹화하여 각 집단의 성격을 파악하는데, 실제적으로 각 객체가 유사한지 그렇치 않은지를 측정할수 있는 도구가 필요하다. 기존의 군집화에서 객체간에 유사하다는 의미는 각군집 안에서 있는 객체들이 같은 속성값이 많으면 많을수록 객체간에 유사성이 높아 유사도가 높은 객체끼리 군집을 이루게 된다는 것을 의미했다.

 

그중에서도 범주형 속성을 갖는 군집화는 같은 속성값이면 1, 서로 다르면 0으로 표현하여 유사성을 측정하는 방법이다.

(항목 유사도를 고려한 트랜잭션 클러스터링, 한양대학교, 이상욱)


군집화 알고리즘의 분류

군집화 알고리즘은 매우 대양하고 많다. "군집이 계층을 형성하느냐 그렇지 않느냐?" "그래프 자료구조를 사용하느냐?" "신경망 학습 알고리즘을 사용하느냐""효율적 공간 탐색연산을 사용하느냐" 등 같이 알고리즘이 사용하는 기본적인 연산에 따라 구분할 수 있다. 또한 시간 복잡도에 따라 적은 규모의 테이터만 다룰수 있는지 안니면 수백만 ~ 수 십억만 의 대용량 자룔를 다룰수 있는지에 따라 구분 지을 수도 있다.

방법론이 다양한 이유는 군집화의 문제에 본질적인 성질에 기인
패턴인식분야에서 군집화처럼 주관이 많이 개입하는 문제는 드물다

연관규칙

최소지지도를 만족하는 항목들간의 연관성을 찾아내어 유용한 규칙들을 발견하는 기법

) 붉은색 (x1) 스포츠카(x2) 를 타고  애완견(x3) 을가진  여성들의 90%는 샤넬(x4) 사용한다.

x1+x2+x3 = x4 란 공식이 나온다.

(항목 유사도를 고려한 트랜잭션 클러스터링, 한양대학교, 이상욱)

선형 분류기(linear separable) 

선형 분류기는 성형분리 가능한 두개의 클래스를 이루는 데이터를 분류하는 판별식으로 정의된다. 이차원 데이터에 대한 판별식은 직성이 되고, 3차원 데이터에 대한 판별식은 2차원 평면이 된다. 2차원 이상일 경우는 초평면 (hyper-plane)이 판별식이 된다.

분류

데이터베이스에 있는 레코드들을 여러개의 클래스들로 분류했을때 각 클래스의 특징을 찾아내는 작업이다. 예를 들어 기존고객들의 신용위험도를 분류하면 새로운 고객의 신용경력 현재부채 담보물및 소득에 의해고객의 신용위험도가 추정될수 있을 것이다.

(항목 유사도를 고려한 트랜잭션 클러스터링, 한양대학교, 이상욱)


SVM의 특성

사용자 설정 매개 변수가 적다.

커널 종류와 커널에 따른 매개 변수

최적 커널을 자동 설정하는 방법 없음

실험에 의한 휴리스틱한 선택

일반화 능력 뛰어남

구현이 까다로움

OSS 활용

SVMlight

LIBSVM

오일석, 패턴인식, 교보문고

 

 

 실질  예측결과가 얼마나 좋은지를 알려면 기초 함수용 최적인자들을 선택할 수 있어야한다. LIBSVM은 모델에 대한 교차검정을 제공하고있다.

신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'A.I. > SVM' 카테고리의 다른 글

SVM 정리  (2) 2008.12.21
posted by Terapi
prev 1 next

티스토리 툴바