분류 전체보기 219

[Ubuntu 20.04] ROS Noetic 설치

ROS란? ROS는 "Robot Operating System"의 약자로, 로봇 소프트웨어 개발을 위한 유연한 프레임워크이다. ROS는 실제 운영 체제(OS)가 아니라 로봇 프로그래밍을 위한 미들웨어, 즉 통신 인터페이스, 소프트웨어 라이브러리, 도구, 규약, 그리고 기능을 제공하는 집합체다. ROS는 여러 버전이 존재하므로 Ubuntu 버전에 따라 알맞은 환경을 구축해야 한다. Ubuntu 20.04에는 ROS Noetic 버전이 호환되므로 Noetic을 설치해서 사용한다. noetic/Installation/Ubuntu - ROS Wiki If you rely on these packages, please support OSRF. These packages are built and hosted on ..

ROS 2024.03.27

Physics-based Deep Learning - Supervised Training

Welcome … — Physics-based Deep Learning www.physicsbaseddeeplearning.org "지도학습"은 DL의 맥락에서 마주칠 모든 프로젝트의 출발점이며, 따라서 연구할 가치가 있다. 따라서, 좋은 모델 방정식이 존재하지 않는 특정 응용 시나리오에서는 유일한 선택지가 될 수 있다. Problem Setting 지도학습의 예로 미지 함수 𝑓*(𝑥) = 𝑦* 를 근사화 하는 과정을 살펴보자 [𝑥0, 𝑦0], ...[𝑥𝑛, 𝑦𝑛] : 훈련 데이터 (입력 𝑥와 목표 출력 𝑦* 쌍으로 구성) f의 가중치 θ를 조정함으로써 손실 함수 최소화 즉, 𝑓(𝑥; 𝜃) = 𝑦 ≈ 𝑦* 가 가능한 한 정확하게 되도록 θ 를 제공 가장 단순한 L2 Loss로 가정 물리 모델 P를 해결하..

논문 2024.03.26

[논문] Accurate Head Pose Estimation Using Image Rectification and a Lightweight Convolutional Neural Network

Abstract 본 논문은 머리 자세 추정의 정확도를 향상시키기 위한 새로운 접근 방식을 제안한다. 제안된 방법은 원근 왜곡의 부정적 영향을 줄이기 위해 이미지 보정을 사용하고, 가벼운 합성곱 신경망을 통해 높은 정확도의 머리 자세 추정을 달성했다. 카메라의 광축과 얼굴 중심의 투영 벡터 사이의 각도를 계산하여 얼굴 이미지를 정위치화하고, 이를 입력으로 사용해 머리 자세를 추정한다. 실험 결과는 제시된 방법이 최신 기법에 비해 더 높은 정확도와 더 빠른 처리 속도를 달성함을 보여준다. I. INTRODUCTION 최근, RGB 또는 RGBD 카메라와 같은 소비자용 이미지 기반 장비를 사용해 머리 포즈 추정을 더 단순하고 일반적인 방식으로 할 수 있는 기술이 개발됐다. 이 기술은 깊이 정보를 사용하여 정확..

논문 2024.03.25

[논문] AAM Based Facial Feature Tracking with Kinect

https://www.researchgate.net/publication/282796794_AAM_Based_Facial_Feature_Tracking_with_Kinect Abstract 본 논문은 Kinect에서 얻은 깊이(Depth) 데이터를 활용하여 AAM(Active Appearance Model, 활성 외형 모델)의 시야각 변화 문제를 해결하는 방법을 제시한다. 깊이 데이터로 머리 포즈 정보를 얻고, 이를 바탕으로 3D 얼굴 그리드 모델을 초기화 및 조정하여 얼굴 특징을 정확히 추적한다. 이 방법은 머리를 회전할 때의 AAM 성능을 향상시킨다. ※ AAM : 이미지 내의 객체, 특히 얼굴의 형태(shape)와 외형(appearance)을 동시에 모델링하는 컴퓨터 비전 기술 1. Introduc..

논문 2024.03.25

[논문] ImageNet Classification with Deep Convolutional Neural Network

ImageNet Classification with Deep Convolutional Neural Networks Requests for name changes in the electronic proceedings will be accepted with no questions asked. However name changes may cause bibliographic tracking issues. Authors are asked to consider this carefully and discuss it with their co-authors prior to reque papers.nips.cc Abstract ImageNet LSVRC-2010 대회에서 1.2백만 고해상도 이미지를 1000개 클래스로 분..

논문 2024.03.25

L1 Loss & L2 Loss

L1 Loss와 L2 Loss는 머신러닝과 딥러닝에서 널리 사용되는 두 가지 손실 함수(loss function)이다. 두 손실 함수는 모델의 예측값과 실제값 사이의 차이를 측정하는 방법을 제공하여, 모델이 학습 과정에서 이 차이를 최소화하도록 돕는다. L1 Loss (Mean Absolute Error, MAE) 정의 : L1 Loss는 예측값과 실제값 사이의 절대값 차이의 평균을 계산한다. 수학적으로는 다음과 같이 표현된다. $$ MAE = \frac{1}{N}\sum_{i=1}^{N}|y_{i} - \hat{y}_{i}| $$ 특징 및 사용 경우 로버스트함(Robustness) : L1 Loss는 이상치(outliers)에 덜 민감하기 때문에 이상치가 많은 데이터에 적합하다. 스파시티(Sparsit..

딥러닝 2024.03.22

[논문] RGB-D camera pose estimation using deep neural network

Request Rejected ieeexplore.ieee.org Abstract 본 논문은 딥러닝 기술을 사용하여 RGB-D 카메라 포즈 추정에 대한 연구를 제시한다. 제안된 네트워크 구조는 시각 정보를 활용하는 컨볼루션 신경망(CNN)과 시간적 정보를 포함하는 장단기 기억(LSTM) 블록, 총 2 가지 구성 요소로 이루어져 있다. 1. CNN RGB-D 데이터를 기반으로 한 GoogLeNet 변형으로, 카메라 포즈를 추정하는 특성 중심의 기능을 수행 2. LSTM 포즈 추정의 시간적 연속성을 모델링하여 정확도를 높임 또한, 포즈 매개변수의 효과적인 수렴을 지원하는 수정된 Loss Function 도입한다. 실험을 통해 CNN과 LSTM의 조합이 포즈 추정의 정확도를 크게 향상시키며, 네트워크의 파이프..

논문 2024.03.18

Physics-based Deep Learning - Overview

Welcome … — Physics-based Deep Learning www.physicsbaseddeeplearning.org Overview 2.1 Motivation Replacing traditional simulations? 딥러닝은 이미 많은 분야에서 뛰어난 성과를 보였지만, 이 기술이 최대의 잠재력을 발휘하기 위해서는 물리 모델의 도메인 지식이 필요하다. 전통적인 수치 모델링 방법은 정확하고 신뢰할 수 있는 결과를 제공하는 반면, 딥러닝은 모델링을 통해 얻은 데이터로부터 더 심층적인 통찰력을 추출할 수 있다. 이 책은 딥러닝을 적용할 때 전통적인 수치 수학 방법을 활용하는 것의 중요성을 강조하며, 두 결합이 다음 세대의 시뮬레이션 시스템 발전에 핵심적일 것임을 주장한다. Reconcilin..

논문 2024.03.15

[Deep Learning / Pytorch] Dataset & DataLoader

파이토치(PyTorch)에서 Dataset과 DataLoader를 사용하는 주된 이유는 데이터를 효율적으로 처리하고, 모델 학습을 위한 데이터 로딩을 보다 유연하고 관리하기 쉽게 만들기 위해서 사용된다. 이러한 추상화가 불편해 보일 수 있지만, 실제로는 대규모 데이터셋을 다루거나 복잡한 데이터 전처리 과정을 통합할 때 매우 유용하다. Dataset 데이터 추상화: Dataset 클래스는 데이터셋에 대한 추상화를 제공하며, 사용자는 이를 상속받아 __getitem__과 __len__ 메서드를 구현함으로써 데이터의 로딩 방식을 커스터마이징할 수 있다. 이는 다양한 데이터 소스(이미지, 텍스트 파일, CSV 등)를 동일한 인터페이스로 처리할 수 있게 해준다. 유연성: 사용자 정의 데이터셋을 만들 수 있어, 데..

딥러닝/Pytorch 2024.03.12

[Deep Learning] F1 Score 이란

F1 점수(F1 Score)는 분류 작업에서 정밀도(Precision)와 재현율(Recall)의 조화 평균을 사용하여 모델의 정확성을 평가하는 지표다. 이 지표는 데이터셋에 불균형이 있을 때, 즉 어떤 클래스의 샘플이 다른 클래스 샘플 수 보다 훨씬 많아 불균형을 이룰 때 유용하다. F1 점수는 0부터 1 사이의 값으로 표현되며, 1에 가까울수록 모델의 성능이 뛰어남을 의미한다. ※ 조화 평균 : 주어진 수들의 역수의 산술 평균의 역수를 말한다. 평균적인 변화율을 구할 때에 주로 사용 F1 Score expression ※ 정밀도(Precision) : 모델이 양성이라고 예측한 것들 중 실제로 양성인 비율 ※ 재현율(Recall) : 실제 양성 중 모델이 양성으로 올바르게 예측한 비율 True Posit..

딥러닝 2024.03.12