Coursera 기계 학습 특화 과정 Week 1&2

작성자: 정석훈 본 글은 Coursera에서 제공하는 기계 학습 특화 과정의 1주차, 2 내용을 정리한 글입니다. 기계 학습(Machine Learning)은 미국의 컴퓨터 과학자 아서 새뮤얼이 보급한 용어로, 그는 기계 학습을 아래와 같이 정의했습니다. 기계 학습이란, 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 부여하고자 하는 학문이다. 대표적인 기계 학습 알고리즘은 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 추천 시스템(Recommender Systems), 강화 학습(Reinforcement Learning) 등이 있습니다...

더보기

딥러닝과 음성 데이터셋

작성자: 김우진 딥러닝 딥러닝이란 머신러닝의 한 방법으로, 학습 과정 동안 여러 층을 가진 인공신경망(ANN, Artificial Neural Network)을 사용하여 예시 데이터에서 얻은 규칙을 통해 데이터를 예측하는 기술입니다. 많은 일반적인 사람들은 딥러닝이라는 기술을 알파고를 통해 알게되었습니다. 하지만, 딥러닝의 시작은 2012년부터 였습니다. 이미지넷 2007년부터 시작된 이미지넷 프로젝트는 컴퓨터에게 이미지를 이해시키는 것에 대한 연구를 하기 위해서 시작되었습니다. 이미지넷 프로젝트는 컴퓨터를 이해시키기 위해서 인터넷에서 약 10억 장의 이미지를 구했고, 이를 오픈소스로 공개했습니다. 2010...

더보기

Paper review: VisualPhishNet

작성자: 심소연 VisualPhishNet 논문 리뷰 안녕하세요? 저는 이번에 블로그 글 작성을 맡게 된 20181144 심소연이라고 합니다. 저는 논문 리뷰를 통해 머신 러닝이 보안 분야에서 어떻게 사용될 수 있는지에 대해 간략히 알아보는 글을 작성하고자 합니다. 제가 리뷰할 논문은 ‘VisualPhishNet: Zero-Day Phishing Website Detection by Visual Similarity’ 입니다. 논문은 여기에서 보실 수 있습니다. 이 논문은 시각적 유사성을 기반으로 피싱 사이트를 탐지할 수 있는 기술인 VisualPhishNet을 다루었습니다. ✅ 피싱 사이트란? ...

더보기

Brand New Style

작성자: 김선욱 Style-Transfer 스타일 트랜스퍼(style transfer)란 스타일 이미지(style image)가 주어졌을 때, 해당 이미지를 그대로 필터처럼 사용하는 것이 아닌 특징(feature)을 추출하여 타겟으로 삼는 콘텐츠 이미지(content image)에 전이(transfer)시키는 기법입니다. 이러한 특징을 스타일(style)이라고 부르며, 이를 실현하기 위해 생성적 적대 신경망(GAN, Generative Adverserial Networks) 등이 사용됩니다. 역사 & 구성 스타일 트랜스퍼는 2015년 Leon A. Gatys 등의 A Neural Algorithm o...

더보기

Chatbot

# title tags 챗봇에 대해 알아보자 study 작성자 : 황지현 Chatbot 챗봇은 NLP 관점에서 대화 시스템으로 분류되며 기본적으로는 사용자와 자연스럽게 대화할 수 있도록 서비스하는 소프트웨어 애플리케이션으로 AI와 NLP를 사용하고 있습니다. 기본적으로는 사용자의 입력을 받아들인 후 의미를 해석하고 적절한 응답을 제공하는 형식입니다. Task-oriented diaglogue system 기업에서 주로 활용하고 있으며 분류 그대로 문제를 해결하기 위한 목적을 가지고 있습니다. 사...

더보기

텍스트 전처리 기법

작성자: 유인재 텍스트 전처리 기법 Machine Learning을 진행하기에 앞서 우리는 항상 학습을 진행할 데이터와 마주하게 된다. 이러한 데이터들은 전처리 과정이 필수적으로 수반되어져야 하는데, 학습하기 용이하게 되어있지 않을 뿐더러 Null data와 불균등한 분포를 가지고 있다. 이뿐만이 아니다. 숫자로만 데이터가 이루어져 있을거라는 제약을 벗어난다면, 문자열도 얼마든지 데이터에 포함되어 있을 것이다. 하지만 이렇게 datatype이 문자열(텍스트)인 데이터가 포함된 데이터를 학습시키는 방법은 기존과 달라야 할 것이다. 앞으로 소개될 내용들을 통해, 텍스트로 이루어진 데이터를 처리하는 방법들에 다...

더보기

feature scaling이란

작성자 : 최준영 Feature Scaling 머신 러닝에 사용될 데이터셋들은 대부분 다양한 feature 들을 가지게 됩니다. 그리고 머신러닝 모델은 이 feature들의 패턴과 상관관계를 찾아 의사결정 또는 예측을 하게 됩니다. feature 들은 다양한 정보를 숫자 또는 문자열로 가지며 이 값들은 제각기 다른 단위, 범위를 가집니다. ex) 키(단위 : cm , 범위 : 0~200), 몸무게(단위 : kg, 범위 : 0~150), 재산(단위 : 원, 범위 : -1,000,000,000 ~ +1,000,000,000)) 하지만 모델들은 이 숫자들이 무엇을 나타내는지, 단위는 무엇인지 모른채 이들의 패턴들을...

더보기

어떻게 인공지능 분야 논문을 찾을 것인가??

작성자: 안윤표 논문이란? 논문은 하나의 주제에 대해서 학문적 연구 성과를 발표한 글입니다. 학문적 연구 성과에는 하나의 문제를 좋은 방법으로 해결하는 방법이나 이에 대한 의견이 포함됩니다. brAIns의 분야인 인공지능을 예시로 든다면, 이미지를 분류하는 문제(주제)를 최고 성능(SOTA, state-of-the-art)을 달성한다면 하나의 좋은 논문이 될 것입니다. 이 글 시리즈에서는 여러 분야의 논문보다는 특히 인공지능 분야 논문을 왜 읽어야 하고 어떻게 읽고, 발표할지에 대해 다루고자 합니다. 왜 논문을 읽어야 하는가? 인공지능 분야는 다른 분야와 달리 매우 빠르게 발전하고 있습니다. 5년 전의 책이...

더보기