목록AI (10)
초오오오오오짜개발자의낙서장
전처리용 필터링 방법 정리 🛠️불량 검출을 위한 이미지 처리 과정에서 가장 먼저 수행되는 단계가 **전처리(Preprocessing)**다. 전처리 단계에서는 영상 획득 과정에서 생긴 다양한 잡음을 제거해 결함 인식률을 높이고, 이후 특징 강조나 딥러닝 기반 분석이 더 정확하게 이루어지도록 돕는다. 대표적인 전처리용 필터링 방법은 다음과 같다.1. 가우시안 필터 (Gaussian Filter)영상 전체를 부드럽게 블러 처리해 랜덤 노이즈를 줄인다.픽셀 값 주변을 가우시안 분포에 따라 평균화하기 때문에 자연스러운 흐림 효과를 만든다.주로 영상 전반적인 노이즈 제거에 활용된다.2. 미디언 필터 (Median Filter)주변 픽셀 값의 중간값을 사용해 새로운 픽셀 값을 만든다.Salt-and-pepper ..
mac mini에 설치하기 전에 ubuntu에 설치를 시도했으나 설치가 되지 않아 삽질한 경험을 적어보고자 한다. 로컬에 설치하는 방법은 위와 같다.맞다 굉장히 심플하다.요구하는 nodejs 와 npm을 우선 설치하고 위 명령어를 입력하면 이와같이 path 가 없다고 onboard 가 실행되지 않는다.copilot을 이용해 문의하니 위와같이 답변을 해준다. vim ~/.bashrc 에 위와 같이 경로 설정을 해주었으나 openclaw는 반응이 없다. 위의 방법보다는 docker로 하는 방법이 더 쉬울것 같아 도커로 설치를 시도했으나 다음과 같은 에러에서 막혔다..트러블 슈팅이지만 트러블만 만나고 제대로된 슈팅을 하지 못했다..해결되면 방법을 정리하여 보완할 계획이다. ---02/23-- 추가원인을 ..
요새 뜨고있는 램값 이슈로 인하여 맥미니를 슥 사버렷다. 아직 배송중인 맥미니이지만 홈서버의 우분투 환경에 설치가 가능하다는 이야기를 듣고 올해로 13살이되신 홈 서버님께 오픈 클로 설치를 부탁드렸지만 npm 에러가 나면서 설치를 거부하셧다. 시간이 많이 없어서 에러 분석은 하지못했지만 시간이 나면 설치를 계속 진행할 것이다. 그래서 오픈클로는 무엇인가? 오픈클로는 최근 급부상한 오픈소스 AI 에이전트 플랫폼으로, 단순히 대화만 하는 챗봇이 아니라 실제로 사용자의 컴퓨터와 인터넷 환경을 직접 조작해 업무를 수행할 수 있는 도구입니다. 주요 특징실행력 있는 AI단순히 답변을 주는 것이 아니라, 브라우저를 열고 웹에서 정보를 수집하거나 이메일을 작성·전송하는 등 실제 행동을 수행합니다.멀티플랫폼 지원슬랙(S..
YOLO-NAS는 Deci AI가 개발한 차세대 객체 탐지(Object Detection) 모델로, Neural Architecture Search(NAS) 기술을 기반으로 만들어짐.기존 YOLO 계열 모델의 한계를 개선하며 실시간 성능과 정확도를 동시에 확보한 것이 특징. 주요 특징NAS 기반 자동 설계: 모델 구조를 사람이 직접 설계하지 않고, NAS를 통해 최적화된 구조를 자동으로 탐색.양자화 지원 강화: Quantization-aware blocks와 selective quantization을 적용하여 INT8 변환 시에도 정확도 손실 최소화.실시간 객체 탐지 성능: 높은 FPS와 낮은 지연(latency)로 엣지 디바이스에서도 활용 가능.정확도 향상: 작은 객체 탐지 능력 개선 및 위치 정확도 ..
최근 Meta에서 발표한 SAM3 라는 모델을 알게되었다.텍스트나 이미지 프롬프트를 통해 이미지와 영상 속 개념을 자동으로 분할하고 추적할수 있는 기능을 갖추었다고 한다. 지금 진행하는 프로젝트에 SAM3를 적용할수 있는지 알아보려고 한다.사용자가 텍스트 프롬프트를 통해 이미지에서 객체를 탐지 가능하다고 하기때문에 프롬프팅을 잘 만들어야될거같다.하지만 비정형 데이터같은 형태를 정의하기 모호한 경우는 어떻게 하는지 고민이 앞선다. sam1은 이미지 내 객체를 클릭이나 박스로 직접 지정하여 분할sam2는 비디오 영역까지 확장된 상호작용 기반 분할sam3는 텍스트,이미지 기반 개념을 통해 자동분할 sam3는 기존 시스템보다 2배이상의 성능 향상을 달성하였다고 한다. sam3는 픽셀 수준의 분할을 뛰어넘어 의미..
- chat gpt와 같은 대규모 언어 모델은 심층 신경망 모델(deep neural network) 이다- 이 모델들은 자연어 처리(natural language processing)에 큰 기여를 했다.- LLM이 등장하기 전까지는 간단한 패턴 인식 모델로 감지했다- 다양한 상황( 지시를 분석, 맥락을 이해) 등을 수행하지 못했다. - LLM은 사람의 언어를 이해한다.- 여기서 이해는 사람의 이해가 아닌 일관성 있고 맥락에 맞도록 텍스트를 처리, 생성 하는것- 딥러닝의 발전으로 대규모 훈련 덕분에 LLM은 사람 언어의 미묘함과 문맥 정보를 깊이 이해한다.- LLM은 텍스트 번역, 감성 분석, 질문 답변 등 NLP 작업에서의 성능이 크게 발전함. 현대 LLM 과 이전 NLP 모델과의 차이- 이전 NLP ..
이번주는 외부 교육으로 인하여 개발을 하지 못하였다.. 대신 수업에서 들은 것중 흥미로운 것을 공유 하고자 한다. - apple의 공식 Create ML 문서:developer.apple.com/kr/machine-learning/create-ml -apple wwdc 2019의 간단한 플랫폼 사용 동영상:developer.apple.com/videos/play/wwdc2019/430 아이패드와 아이폰으로 학습 모델을 돌려볼수가 있다. 수업에서는 아이폰을 카메라로 아이패드를 판독 기기로 하여 이미지 분류 작업을 진행했다. transfer learning 같아 보였지만 정확도나 인식 부분이 꽤 잘 되어서 업무에도 사용 가능하지 않나 생각해본다.
3.신경망- 퍼셉트론 으로는 복잡한 함수를 표현 가능하다!- 가중치 설정은 사람이 수동으로 해야한다.- 신경망은 사람이 수동으로 가중치를 설정하는 것을 처리해 준다.3.1 퍼셉트론에서 신경망으로- 신경망은 앞 장에서 설명한 퍼셉트론과 공통점이 많다!- 여기서는 퍼셉트론과 다른 점을 중심으로 신경망의 구조를 설명한다.3.1.1- 신경망을 그림으로 나타내면 다음과 같이 나타난다.- 은닉층은 사람의 눈에 보이지 않기 때문에 은닉층이다.- 입력층에서 출력층 방향으로 0,1,2 층 이라고 한다.3.1.2 퍼셉트론 복습- 앞에서 우리는 퍼셉트론에서 bias 부분을 배웠다. - bias 부분의 퍼셉트론은 그림 3-3과 같다!그림 3-3-위의 그림에서는 가중치가 b 이고 입력이 1인 뉴런이 추가되었다.- 이 퍼..