목록전체 글 (53)
초오오오오오짜개발자의낙서장
YOLO-NAS는 Deci AI가 개발한 차세대 객체 탐지(Object Detection) 모델로, Neural Architecture Search(NAS) 기술을 기반으로 만들어짐.기존 YOLO 계열 모델의 한계를 개선하며 실시간 성능과 정확도를 동시에 확보한 것이 특징. 주요 특징NAS 기반 자동 설계: 모델 구조를 사람이 직접 설계하지 않고, NAS를 통해 최적화된 구조를 자동으로 탐색.양자화 지원 강화: Quantization-aware blocks와 selective quantization을 적용하여 INT8 변환 시에도 정확도 손실 최소화.실시간 객체 탐지 성능: 높은 FPS와 낮은 지연(latency)로 엣지 디바이스에서도 활용 가능.정확도 향상: 작은 객체 탐지 능력 개선 및 위치 정확도 ..
최근 Meta에서 발표한 SAM3 라는 모델을 알게되었다.텍스트나 이미지 프롬프트를 통해 이미지와 영상 속 개념을 자동으로 분할하고 추적할수 있는 기능을 갖추었다고 한다. 지금 진행하는 프로젝트에 SAM3를 적용할수 있는지 알아보려고 한다.사용자가 텍스트 프롬프트를 통해 이미지에서 객체를 탐지 가능하다고 하기때문에 프롬프팅을 잘 만들어야될거같다.하지만 비정형 데이터같은 형태를 정의하기 모호한 경우는 어떻게 하는지 고민이 앞선다. sam1은 이미지 내 객체를 클릭이나 박스로 직접 지정하여 분할sam2는 비디오 영역까지 확장된 상호작용 기반 분할sam3는 텍스트,이미지 기반 개념을 통해 자동분할 sam3는 기존 시스템보다 2배이상의 성능 향상을 달성하였다고 한다. sam3는 픽셀 수준의 분할을 뛰어넘어 의미..
9월 말에 면접을 봤던 회사가 답변을 10월 말에 회신을 주어 1달간 다니던 회사를 그만두고 새로운 회사로 옮겨감.진로를 풀스택으로 잡으려 했으나 새로운 회사는 비전 ai로 솔루션 개발하는 si 회사라서 회귀하게됨.레거시 코드와 수습기간동안 배우는게 너무 많았다.할일이 없을줄 알았던 비전 ai를 2년만에 하게되어 리뷰하는게 버거웠다.11월 말부터는 혼자 출장을 가게되어 회사에 잘 적응을 한 느낌이다.
파이썬에서 스레드를 사용하려면 threading 모듈을 사용하며, Thread 객체를 생성하고 start() 메서드를 호출하여 시작한다. 스레드는 프로세스 내에서 실행되는 작은 단위로, start() 메서드로 실행을 시작한 후, join() 메서드를 사용하면 모든 스레드의 작업이 끝날 때까지 기다린다. 스레드는 동시성을 구현하는 데 사용되지만, 파이썬의 GIL(Global Interpreter Lock) 때문에 CPU 집약적인 작업에서는 진정한 의미의 병렬 처리가 어렵고, I/O 바운드 작업에 더 적합하다. 위 스레드를 이용하여 딥러닝 학습 스케줄러를 만들어볼 계획이다.(자세한 코드는 깃허브 참고)
웹브라우저 미니게임 프로젝트를 진행하던 도중 카메라의 움직임이 너무 어색하여 부드럽게 움직이게하는 방법을 찾는도중 Linear 함수를 찾았다.작동원리Phaser.Math.Linear(start, end, t)start : 시작 값end : 끝 값t : 0~1 사이의 보간 인자, 0이면 시작값 1이면 끝값 리턴값은 start + (end -start) * t 이다.게임에서 값이 값자기 바뀌지 않고 부드럽게 변화하도록 할때 사용한다. 라고 정의되어있다. 따라서 카메라 줌이나 위치, 오브젝트 이동등에서 부드럽게 값을 변환 시키기 위해 사용한다. this.cameras.main.setZoom( Phaser.Math.Linear( this.cameras.main.zo..
- chat gpt와 같은 대규모 언어 모델은 심층 신경망 모델(deep neural network) 이다- 이 모델들은 자연어 처리(natural language processing)에 큰 기여를 했다.- LLM이 등장하기 전까지는 간단한 패턴 인식 모델로 감지했다- 다양한 상황( 지시를 분석, 맥락을 이해) 등을 수행하지 못했다. - LLM은 사람의 언어를 이해한다.- 여기서 이해는 사람의 이해가 아닌 일관성 있고 맥락에 맞도록 텍스트를 처리, 생성 하는것- 딥러닝의 발전으로 대규모 훈련 덕분에 LLM은 사람 언어의 미묘함과 문맥 정보를 깊이 이해한다.- LLM은 텍스트 번역, 감성 분석, 질문 답변 등 NLP 작업에서의 성능이 크게 발전함. 현대 LLM 과 이전 NLP 모델과의 차이- 이전 NLP ..
SSE - Server Sent Event- 클라이언트는 서버로 부터 데이터를 받을수만 있다.- 웹소켓 과는 달리 서버로부터 오는 단방향 데이터 통신이다.(mono-directional)- 서버에서 클라이언트로 실시간 이벤트를 전달하는 웹 기술 배경- HTTP 특징인 비연결성은 연결한 적이 있어도 연결을 끊어버린다는 것이다.- 이를 해결하기 위한 웹 기술은 Polling, Long Polling, WebSocket, SSE가 있다.- 여기서 SSE는 단방향 통신이며 클라이언트의 별도 추사요청 없이 서버에서 업데이트를 스트리밍 할 수 없다는 특징을 가진다. 장점- HTTP를 통해 통신하므로 다른 프로토콜은 필요가 없고, 구현이 굉장히 쉽다.- 네트워크 연결이 끊겼을 때 자동으로 재연결을 시도.- 실시간으로..
프록시란? - 서버와 클라이언트 사이의 중계 역할 자체를 프록시 라고 하고, 그 중계 기능을 하는 장치 또는 응용 프로그램을 프록시 서버라고 한다.- 네트워크 구조에 프록시 서버가 사용되는 위치에 따라 Forward Proxy, Reverse Proxy로 구분된다. 프록시의 종류1. Forward Proxy- 일반적인 프록시 형태- 클라이언트가 직접 인터넷에 접근하는 것이 아닌 클라이언트 단 앞에 Proxy Server를 위치시켜 Proxy Server가 요청을 받고 인터넷에 연결하여 서버와 통신 후 클라이언트에게 반환하는 방식 이점- Proxy의 기능 중 하나인 캐싱 기능을 이용하여 이전의 요청과 동일한 요청이 수신될 경우 프록시 서버에 응답을 저장해두고 클라이언트에게 전달함으로써 불필요한 부하를 줄여..
