목록DeepLearning (7)
초오오오오오짜개발자의낙서장
YOLO-NAS는 Deci AI가 개발한 차세대 객체 탐지(Object Detection) 모델로, Neural Architecture Search(NAS) 기술을 기반으로 만들어짐.기존 YOLO 계열 모델의 한계를 개선하며 실시간 성능과 정확도를 동시에 확보한 것이 특징. 주요 특징NAS 기반 자동 설계: 모델 구조를 사람이 직접 설계하지 않고, NAS를 통해 최적화된 구조를 자동으로 탐색.양자화 지원 강화: Quantization-aware blocks와 selective quantization을 적용하여 INT8 변환 시에도 정확도 손실 최소화.실시간 객체 탐지 성능: 높은 FPS와 낮은 지연(latency)로 엣지 디바이스에서도 활용 가능.정확도 향상: 작은 객체 탐지 능력 개선 및 위치 정확도 ..
최근 Meta에서 발표한 SAM3 라는 모델을 알게되었다.텍스트나 이미지 프롬프트를 통해 이미지와 영상 속 개념을 자동으로 분할하고 추적할수 있는 기능을 갖추었다고 한다. 지금 진행하는 프로젝트에 SAM3를 적용할수 있는지 알아보려고 한다.사용자가 텍스트 프롬프트를 통해 이미지에서 객체를 탐지 가능하다고 하기때문에 프롬프팅을 잘 만들어야될거같다.하지만 비정형 데이터같은 형태를 정의하기 모호한 경우는 어떻게 하는지 고민이 앞선다. sam1은 이미지 내 객체를 클릭이나 박스로 직접 지정하여 분할sam2는 비디오 영역까지 확장된 상호작용 기반 분할sam3는 텍스트,이미지 기반 개념을 통해 자동분할 sam3는 기존 시스템보다 2배이상의 성능 향상을 달성하였다고 한다. sam3는 픽셀 수준의 분할을 뛰어넘어 의미..
- chat gpt와 같은 대규모 언어 모델은 심층 신경망 모델(deep neural network) 이다- 이 모델들은 자연어 처리(natural language processing)에 큰 기여를 했다.- LLM이 등장하기 전까지는 간단한 패턴 인식 모델로 감지했다- 다양한 상황( 지시를 분석, 맥락을 이해) 등을 수행하지 못했다. - LLM은 사람의 언어를 이해한다.- 여기서 이해는 사람의 이해가 아닌 일관성 있고 맥락에 맞도록 텍스트를 처리, 생성 하는것- 딥러닝의 발전으로 대규모 훈련 덕분에 LLM은 사람 언어의 미묘함과 문맥 정보를 깊이 이해한다.- LLM은 텍스트 번역, 감성 분석, 질문 답변 등 NLP 작업에서의 성능이 크게 발전함. 현대 LLM 과 이전 NLP 모델과의 차이- 이전 NLP ..
이번주는 외부 교육으로 인하여 개발을 하지 못하였다.. 대신 수업에서 들은 것중 흥미로운 것을 공유 하고자 한다. - apple의 공식 Create ML 문서:developer.apple.com/kr/machine-learning/create-ml -apple wwdc 2019의 간단한 플랫폼 사용 동영상:developer.apple.com/videos/play/wwdc2019/430 아이패드와 아이폰으로 학습 모델을 돌려볼수가 있다. 수업에서는 아이폰을 카메라로 아이패드를 판독 기기로 하여 이미지 분류 작업을 진행했다. transfer learning 같아 보였지만 정확도나 인식 부분이 꽤 잘 되어서 업무에도 사용 가능하지 않나 생각해본다.
3.신경망- 퍼셉트론 으로는 복잡한 함수를 표현 가능하다!- 가중치 설정은 사람이 수동으로 해야한다.- 신경망은 사람이 수동으로 가중치를 설정하는 것을 처리해 준다.3.1 퍼셉트론에서 신경망으로- 신경망은 앞 장에서 설명한 퍼셉트론과 공통점이 많다!- 여기서는 퍼셉트론과 다른 점을 중심으로 신경망의 구조를 설명한다.3.1.1- 신경망을 그림으로 나타내면 다음과 같이 나타난다.- 은닉층은 사람의 눈에 보이지 않기 때문에 은닉층이다.- 입력층에서 출력층 방향으로 0,1,2 층 이라고 한다.3.1.2 퍼셉트론 복습- 앞에서 우리는 퍼셉트론에서 bias 부분을 배웠다. - bias 부분의 퍼셉트론은 그림 3-3과 같다!그림 3-3-위의 그림에서는 가중치가 b 이고 입력이 1인 뉴런이 추가되었다.- 이 퍼..
2.perceptron (6/5)-퍼셉트론은 신경망(딥러닝) 의 기원이 되는 알고리즘이다!2.1 퍼셉트론이란?- 퍼셉트론은 " 다수의 신호"를 입력으로 받아 하나의 신호를 출력한다!- 신호가 흐른다 1 안흐른다 0 의 값을 가질수 있다!x1, x2은 입력신호 w1, w2은 가중치 y는 출력 신호를 뜻한다위의 그림은 2개의 입력신호를 받는 퍼셉트론의 예시이다!그림의 원을 뉴런 혹은 노드 라고 부른다입력 신호가 뉴런에 보내질 때 고유한 가중치가 곱해진다.뉴런에서는 받은 신호의 총합이 정해진 한계를 넘을때만 1을 출력여기서의 한계를 임계값 Θ(theta)라고 표현이 내용을 식으로 표현하면 다음과 같이 표현이 가능하다.--식 2.1--$$y= \begin{cases}0 ,( w_{1}x_{1} +w_..
1.hello python (5/31)=============================== 1.1 파이썬?? - 간단하고 배우기 쉬운 프로그래밍 언어 - numpy, Scipy와 같은 데이터 처리 라이브러리가 존재 - Caffe, TensorFlow, Chainer, Theano 같은 유명 딥러닝 프레임 워크들이 존재***1.2 파이썬 설치하기 - 파이썬은 2가지 버전이 존재 2 버전 3버전 - 3에서 짠코드는 2에서 실행이 되지 않음 - 책에서는 3을 사용 - 이책의 목표는 외부 라이브러리를 최소한으로 사용하고자 하지만 numpy, matplotlib 이 두가지는 예외로 한다. - 아나콘다를 사..
