논문 10

Physics-based Deep Learning - Supervised Training

Welcome … — Physics-based Deep Learning www.physicsbaseddeeplearning.org "지도학습"은 DL의 맥락에서 마주칠 모든 프로젝트의 출발점이며, 따라서 연구할 가치가 있다. 따라서, 좋은 모델 방정식이 존재하지 않는 특정 응용 시나리오에서는 유일한 선택지가 될 수 있다. Problem Setting 지도학습의 예로 미지 함수 𝑓*(𝑥) = 𝑦* 를 근사화 하는 과정을 살펴보자 [𝑥0, 𝑦0], ...[𝑥𝑛, 𝑦𝑛] : 훈련 데이터 (입력 𝑥와 목표 출력 𝑦* 쌍으로 구성) f의 가중치 θ를 조정함으로써 손실 함수 최소화 즉, 𝑓(𝑥; 𝜃) = 𝑦 ≈ 𝑦* 가 가능한 한 정확하게 되도록 θ 를 제공 가장 단순한 L2 Loss로 가정 물리 모델 P를 해결하..

논문 2024.03.26

[논문] Accurate Head Pose Estimation Using Image Rectification and a Lightweight Convolutional Neural Network

Abstract 본 논문은 머리 자세 추정의 정확도를 향상시키기 위한 새로운 접근 방식을 제안한다. 제안된 방법은 원근 왜곡의 부정적 영향을 줄이기 위해 이미지 보정을 사용하고, 가벼운 합성곱 신경망을 통해 높은 정확도의 머리 자세 추정을 달성했다. 카메라의 광축과 얼굴 중심의 투영 벡터 사이의 각도를 계산하여 얼굴 이미지를 정위치화하고, 이를 입력으로 사용해 머리 자세를 추정한다. 실험 결과는 제시된 방법이 최신 기법에 비해 더 높은 정확도와 더 빠른 처리 속도를 달성함을 보여준다. I. INTRODUCTION 최근, RGB 또는 RGBD 카메라와 같은 소비자용 이미지 기반 장비를 사용해 머리 포즈 추정을 더 단순하고 일반적인 방식으로 할 수 있는 기술이 개발됐다. 이 기술은 깊이 정보를 사용하여 정확..

논문 2024.03.25

[논문] AAM Based Facial Feature Tracking with Kinect

https://www.researchgate.net/publication/282796794_AAM_Based_Facial_Feature_Tracking_with_Kinect Abstract 본 논문은 Kinect에서 얻은 깊이(Depth) 데이터를 활용하여 AAM(Active Appearance Model, 활성 외형 모델)의 시야각 변화 문제를 해결하는 방법을 제시한다. 깊이 데이터로 머리 포즈 정보를 얻고, 이를 바탕으로 3D 얼굴 그리드 모델을 초기화 및 조정하여 얼굴 특징을 정확히 추적한다. 이 방법은 머리를 회전할 때의 AAM 성능을 향상시킨다. ※ AAM : 이미지 내의 객체, 특히 얼굴의 형태(shape)와 외형(appearance)을 동시에 모델링하는 컴퓨터 비전 기술 1. Introduc..

논문 2024.03.25

[논문] ImageNet Classification with Deep Convolutional Neural Network

ImageNet Classification with Deep Convolutional Neural Networks Requests for name changes in the electronic proceedings will be accepted with no questions asked. However name changes may cause bibliographic tracking issues. Authors are asked to consider this carefully and discuss it with their co-authors prior to reque papers.nips.cc Abstract ImageNet LSVRC-2010 대회에서 1.2백만 고해상도 이미지를 1000개 클래스로 분..

논문 2024.03.25

[논문] RGB-D camera pose estimation using deep neural network

Request Rejected ieeexplore.ieee.org Abstract 본 논문은 딥러닝 기술을 사용하여 RGB-D 카메라 포즈 추정에 대한 연구를 제시한다. 제안된 네트워크 구조는 시각 정보를 활용하는 컨볼루션 신경망(CNN)과 시간적 정보를 포함하는 장단기 기억(LSTM) 블록, 총 2 가지 구성 요소로 이루어져 있다. 1. CNN RGB-D 데이터를 기반으로 한 GoogLeNet 변형으로, 카메라 포즈를 추정하는 특성 중심의 기능을 수행 2. LSTM 포즈 추정의 시간적 연속성을 모델링하여 정확도를 높임 또한, 포즈 매개변수의 효과적인 수렴을 지원하는 수정된 Loss Function 도입한다. 실험을 통해 CNN과 LSTM의 조합이 포즈 추정의 정확도를 크게 향상시키며, 네트워크의 파이프..

논문 2024.03.18

Physics-based Deep Learning - Overview

Welcome … — Physics-based Deep Learning www.physicsbaseddeeplearning.org Overview 2.1 Motivation Replacing traditional simulations? 딥러닝은 이미 많은 분야에서 뛰어난 성과를 보였지만, 이 기술이 최대의 잠재력을 발휘하기 위해서는 물리 모델의 도메인 지식이 필요하다. 전통적인 수치 모델링 방법은 정확하고 신뢰할 수 있는 결과를 제공하는 반면, 딥러닝은 모델링을 통해 얻은 데이터로부터 더 심층적인 통찰력을 추출할 수 있다. 이 책은 딥러닝을 적용할 때 전통적인 수치 수학 방법을 활용하는 것의 중요성을 강조하며, 두 결합이 다음 세대의 시뮬레이션 시스템 발전에 핵심적일 것임을 주장한다. Reconcilin..

논문 2024.03.15

[논문] Two-Level Attention-based Fusion Learning for RGB-D Face Recognition

Papers with Code - Two-Level Attention-based Fusion Learning for RGB-D Face Recognition Implemented in one code library. paperswithcode.com Abstract 본 논문은 RGB와 깊이 정보를 융합하여 RGB-D 얼굴 인식의 정확도를 향상시키기 위한 새로운 주의 기반 방법을 제시한다. 컨볼루션 특징 추출기를 사용하여 두 모달리티에서 특징을 추출한 후, 두 단계의 주의 메커니즘을 통해 이 특징들을 융합한다. 특징 맵 간의 관계를 활용 맵의 공간적 특징에 초점을 맞춤 이 과정은 기하학적 변환을 통한 데이터 전처리와 순수 2D RGB 이미지 학습에서의 전이 학습을 통해 지원된다. 제안된 방법은 기존의 전통..

논문 2024.03.11

[논문] A survey on RGB-D datasets

A Survey on RGB-D Datasets RGB-D data is essential for solving many problems in computer vision. Hundreds of public RGB-D datasets containing various scenes, such as indoor, outdoor, aerial, driving, and medical, have been proposed. These datasets are useful for different applicatio arxiv.org Abstract RGB-D 데이터는 컴퓨터 비전에서 많은 문제를 해결하는 데 필수적이다. 실내, 실외, 운전 및 의료 분야와 같은 다양한 분야에서의 수백 개의 공개 RGB-D 데이터셋이 ..

논문 2024.03.10

Physics-based Deep Learning - Introduction

Welcome … — Physics-based Deep Learning www.physicsbaseddeeplearning.org Introduction 그림과 같이 양의 x축을 따라 있는 포물선에는 모든 점에 대해 두 가지 해결책이 있다.(주어진 x 값에 대해 두 개의 y 값(하나는 x축 위에, 다른 하나는 x축 아래에 있는)이 존재한다는 것) Multimodal Target Mode 1 : 하나는 양의 y 값(하늘색 점으로 표시) Mode 2 : 다른 하나는 음의 y 값 (네이비색 점으로 표시) Standard approach 전통적인 학습 방법으로 얻어진 결과 주의를 기울이지 않는다면, 가운데에 보이는 빨간색처럼 완전히 벗어난 근사값을 반환 Differentiable physics approach ..

논문 2024.03.07

[논문] U-Net: Convolutional Networks for Biomedical Image Segmentation

U-Net: Convolutional Networks for Biomedical Image Segmentation There is large consent that successful training of deep networks requires many thousand annotated training samples. In this paper, we present a network and training strategy that relies on the strong use of data augmentation to use the available annotated arxiv.org Abstract 기존의 딥러닝 네트워크의 성공적인 학습을 위해서는 **annotation(주석)**이 달린 방대한 데이터를..

논문 2024.03.03