마이크로소프트 연구원들은 ChatGPT를 사용하여 로봇과 드론을 조작하고 있습니다.

로봇-손.jpg

OpenAI의 ChatGPT는 자연어 프롬프트에 대한 일관된 텍스트 응답 생성뿐만 아니라 인간과 로봇 간 상호작용에서도 역할을 할 수 있으며 센서 피드백을 사용하여 로봇 동작을 위한 코드를 작성할 수 있습니다.

마이크로소프트는 최근 연구를 진행하여 "ChatGPT가 텍스트를 넘어 물리적인 세계를 생각하며 로봇 과제를 해결하는 데 도움이 될 수 있는지"를 확인했습니다. 그 목적은 프로그래밍 언어를 배우지 않거나 로봇 시스템을 이해하지 않아도 사용자가 ChatGPT를 사용하여 로봇을 지시할 수 있는지 확인하는 것이었습니다.

심층 분석: 이들 전문가들은 해커로부터 AI를 보호하려고 경주하고 있습니다. 시간이 부족합니다.

"ChatGPT가 물리 법칙, 작동 환경의 맥락 및 로봇의 물리적 동작이 세계의 상태를 어떻게 변경할 수 있는지 고려하여 문제를 해결하는 방법을 가르치는 것이 주요 과제입니다," Microsoft 자율 시스템 및 로봇 연구 팀은 블로그 글에서 언급합니다.

마이크로소프트 연구자들은 ChatGPT의 능력을 공부하였습니다. ChatGPT는 물체 감지 및 물체 간 거리 데이터에 애플리케이션 인터페이스를 통해 액세스한 후, 주로 파이썬으로 된 로보틱 시나리오에서 코드를 생성하는 것을 탐색하였습니다. 이러한 시나리오에는 제로샷 플래닝 및 코드 생성이 포함됩니다.

ChatGPT는 대량의 코드와 글로 작성된 텍스트로 훈련받아 코드를 생성할 수 있습니다. 이 시스템은 코딩 문제를 해결하고 프로그램을 디버깅하는 능력을 갖추고 있으며, 대화에 대답하고 명확성을 추구하는 독특한 능력도 가지고 있습니다. 또한, Codex도 있습니다. 이는 GitHub의 Copilot 페어 프로그래밍 서비스에서 자동 완성 기능을 제공하는 OpenAI의 GPT-3 기반 모델입니다. 이 서비스는 다양한 언어로 개발자를 위해 코드를 자동 완성합니다.

또한: ChatGPT란 무엇인가요? 알아둘 필요한 모든 정보가 있습니다.

대화와 명확화 능력을 감안할 때, 마이크로소프트는 비기술 사용자와 드론 간의 언어 기반 인터페이스로 ChatGPT의 능력을 시험했습니다. 연구자들이 논문에서 언급했다시피, GPT-3, LaMDA 및 Codex는 공작 및 코드 생성 작업에서 유망하게 나타났지만, ChatGPT는 특히 "자연어 모델과 코드 생성 모델의 장점과 대화의 유연성을 결합한 로봇 공학 분야에있어서 잠재적으로 더 다재다능한 도구"입니다.

연구원들은 자신들의 블로그 게시물에서 다음을 언급합니다: "ChatGPT는 사용자의 지시가 애매모호할 때 명확화 질문을 하며, 검색대를 시각적으로 검사하기 위해 지그재그 패턴과 같은 복잡한 코드 구조를 작성했습니다."

마이크로소프트는 ChatGPT가 로봇 팔을 사용하여 블록을 움직여 마이크로소프트 로고를 만들도록 테스트하였습니다. 연구원들은 또한 ChatGPT에게 드론이 장애물에 충돌하지 않고 지점에 도달하기 위한 알고리즘 작성을 맡겼습니다. 또한 ChatGPT가 실시간으로 센서 피드백을 기반으로 로봇이 어디로 가야 하는지 결정할 수 있는지도 테스트했습니다.

Google Research와 알파벳 소유의 Everyday Robots의 연구원들은 대화형 언어모델인 PaLM(Pathways Language Model)이라 불리는 모델을 이용하여 유사한 로봇 과제에 대한 연구를 수행했습니다. 이 모델을 이용하면 로봇이 열린 질문을 처리하고 합리적인 대답을 할 수 있습니다.

관련 기사

더 보기 >>