Snowflake Cortex AI로 실현하는 멀티 모달 데이터 분석 간소화

Snowflake Cortex AI에서도 이제 네이티브 멀티 모달 AI 기능이 제공되어, 데이터 사일로가 해소되고 별도의 고가 도구를 사용할 필요가 없어집니다. 이번에 새롭게 공개 미리보기(PuPr)로 제공되는 Cortex AI COMPLETE Multimodal은 친숙한 SQL을 사용하여 이미지 및 기타 비정형 데이터를 Snowflake의 쿼리 엔진 내에서 직접 분석할 수 있는 강력한 기능을 제공합니다. 이에 따라 정형 데이터와 비정형 데이터를 보다 효율적이고 간편하게 통합할 수 있습니다. 무엇보다 이 기능은 중요한 데이터를 이동할 필요 없이 Snowflake 데이터, Iceberg 테이블, Amazon S3 같은 오브젝트 스토리지 전반에서 원활하게 작동합니다. Snowflake의 내장형 보안 및 거버넌스를 활용하여 모든 유형의 엔터프라이즈 데이터에서 보다 심층적이고 신뢰할 수 있는 인사이트를 확보할 수 있습니다.
데이터 격차 해소
오늘날의 데이터 중심 환경에서 조직들은 텍스트, 이미지, 오디오, 비디오와 같은 비정형 소스의 인사이트를 정형 데이터와 손쉽게 결합하여 상당한 경쟁 우위를 확보할 수 있습니다. Cortex AI COMPLETE Multimodal을 사용하면 데이터 분석 비용을 줄이면서 복잡한 작업을 간단하게 수행할 수 있습니다. 예를 들어, 텍스트와 이미지를 포함시켜 예측형 모델을 개선할 수 있으며, 의료 영상 자료와 치료 결과 간의 연관성을 밝히거나, 생산 라인 사진에서 제조 결함을 식별할 수 있습니다.
모든 데이터 처리를 데이터가 있는 곳에서
파편화된 데이터 환경과 복잡한 클라우드 아키텍처는 효율성과 혁신을 방해합니다. 이 문제를 해결하기 위해 Cortex AI COMPLETE Multimodal(PuPr)은 단일 보안 통합 플랫폼 내에서 이미지 파일을 직접 처리할 수 있는 솔루션을 제공하여 보다 손쉽게 관리하고 확장할 수 있도록 지원합니다. Cortex AI의 관리형 플랫폼은 Amazon S3 버킷과 같은 외부 클라우드 오브젝트 공급자 또는 Snowflake에 저장된 비정형 데이터를 자동으로 일괄 처리하고 높은 처리량을 제공하므로, 서로 다른 클라우드 서비스 간의 작업을 오케스트레이션하는 솔루션을 구축하는 데 투자할 필요가 없습니다. 이를 통해 시각적 데이터 인사이트와 정형 데이터 간의 통합이 가속화되어 기술 데이터 담당자의 업무 속도와 민첩성이 향상되고, 결과적으로 간소화된 아키텍처는 복잡성을 줄이고 인사이트 도출 시간을 단축하며 총소유비용을 절감합니다.

멀티 모달 분석: 전체적인 그림 파악하기
데이터 사이언티스트는 정형 데이터를 기반으로 구축된 예측형 모델을 사용하는 경우가 많습니다. 그러나 이러한 모델을 정형 데이터에만 의존하면 이미지와 같은 비정형 소스에 존재하는 귀중한 신호를 간과하여 사용자 참여도에 영향을 미치게 됩니다. 데이터 분석가와 데이터 사이언티스트들은 정형 데이터 및 이미지 처리를 위해 별도의 시스템을 유지하지는 대신, 친숙한 Snowflake 환경 내에서 간단한 SQL을 사용하여 기존의 지표와 인텔리전스 사이의 상관 관계를 탐색할 수 있습니다.
다음은 데이터 분석가가 SQL을 사용하여 광고 크리에이티브의 시각적 요소를 분석하여 캠페인 성과의 숨겨진 패턴을 드러내는 방법을 보여주고 있습니다. 기술 팀들은 이와 같은 방식으로 시각적 기능을 추출하여, 소셜 미디어 참여도와 사용자 전환율 간의 관계를 파악할 수 있습니다.
SELECT
c.ad_id,
c.conversion_rate,
snowflake.cortex.complete('claude-3-5-sonnet','Classify the prominent color visible in this image. Respond with the name of the color and nothing else', adimages) as prominent_color ,
snowflake.cortex.complete('claude-3-5-sonnet','Are there human faces identified in the Image? Respond only with TRUE or FALSE and nothing else', adimages) as human_face_flag
FROM campaign_table c join image_table i on c.ad_id i.ad_id
이때 멀티 모달 분석은 기존의 정형 데이터와 풍부한 시각적 인사이트를 결합하여 보다 포괄적인 비즈니스 이해를 도출함으로써 진정한 잠재력을 발휘합니다. 다른 예로는, 리테일 업체에서 제품 사진 메타데이터를 트랜잭션 기록과 통합하여 시각적 요소가 구매 결정에 미치는 영향에 대한 보다 심층적인 인사이트를 확보하는 경우를 들 수 있습니다. 리테일, 제조, 헬스케어, 금융 등 업종에 관계없이 이러한 기능을 활용하면 보다 심층적인 인사이트를 얻고 더 의미 있는 고객 경험을 창출하여 비즈니스 성장을 촉진할 수 있습니다.
AI 기반 멀티 모달 분석을 통한 산업 혁신
조직이 보유하고 있는 방대한 양의 비정형 데이터 자산에는 아직 발굴되지 않은 비즈니스 가치가 존재합니다. Cortex AI 함수는 정형 데이터와 비정형 데이터 분석을 결합하는 단순한 SQL을 통해 이러한 가치를 실현합니다.
마케팅 캠페인 최적화: 마케팅 팀은 Cortex AI를 사용하여 프로모션 자산의 시각적 요소를 전환 지표와 직접 연결하여 캠페인 성과를 혁신합니다. 예를 들어, Snowflake를 사용하는 리테일 기업은 수천 개의 광고 이미지를 분석하여 특정 색상 스키마를 가진 제품 이미지가 특정 인구통계학적 세그먼트에서 더 높은 참여를 창출하는 경향이 있다는 것을 파악할 수 있습니다.
수작업 프로세스 간소화: 온라인 리테일 업체와 식품 배송 플랫폼은 Cortex AI를 사용하여 음식 및 식료품의 이미지 설명을 자동화함으로써 수작업을 줄일 수 있습니다. 제조 산업 시설에서는 시각적 검사 데이터를 프로덕션 사양과 연결하여 결함을 방지할 수 있습니다. 헬스케어 조직은 이미징 메타데이터를 치료 프로토콜 및 인구 통계 자료와 연관시켜 환자의 결과를 개선할 수 있습니다.
고객 서비스 개선: 고객 서비스 부서에서는 단어 간 텍스트 모델을 사용하여 통화 내용을 녹취하고 보다 심층적인 인사이트를 도출합니다. 예를 들어 Cortex 기능을 사용하면 고객 세부 정보와 에이전트 상호 작용뿐만 아니라 다음 단계, 의도 및 감성을 요약하여 고객 경험에 대한 더 완전한 시각을 얻을 수 있습니다.
복잡한 문서 분석: Cortex AI를 사용하는 금융 회사는 텍스트, 테이블, 차트 설명에서 정형 데이터를 추출하여 분기별 보고서, 투자 설명서 및 재무 제표 등을 분석할 수 있습니다. 예를 들어 글로벌 은행의 경우, 안전하고 신뢰할 수 있는 환경 내에서 납세 신고서, 은행 잔고 증명서 및 취업 확인서 등에서 주요 정보를 추출 및 검증하여 대출 신청 절차를 가속화할 수 있습니다.

양질의 결과 제공
비즈니스 의사 결정이 분석에 의존할 때는 질적인 측면이 매우 중요합니다. Cortex AI는 다양한 작업에 맞춤화된 모델과 특수 함수를 통해 다양한 비정형 데이터 처리 작업에 걸쳐 탁월한 품질을 제공합니다.
산업을 선도하는 비전 모델: Cortex AI는 산업을 선도하는 비전 모델에 대한 즉각적이고 안전한 액세스를 제공하기 때문에 사용자의 특정한 비즈니스 요구 사항에 가장 적합한 모델을 선택할 수 있습니다. Cortex AI Complete 함수를 사용하면 포괄적인 시각적 분석을 위해 Anthropic의 Claude 3.5 Sonnet, Mistral AI의 Pixtral Large를 비롯해 앞으로 출시될 Anthropic의 Claude 3.7 Sonnet, Meta의 Llama 4 Scout, Open AI의 GPT-4.1과 같은 옵션을 선택할 수 있습니다.

Claude 3.5 Sonnet는 DocVQA 벤치마크 기준 90.3%라는 매우 인상적인 문서 이해 능력을 갖추고 있어, 재무 제표, 법적 계약 및 규정 준수 설명서에 관한 정보를 추출하는 데 최적의 선택입니다. Pixtral Large는 탁월한 차트 분석(88.1% ChartQA)과 수학적 추론(69.4% Mathvista)으로 재무 보고서 및 제조 사양 측정에 적합합니다. GPT-4.1(곧 출시 예정)은 다이어그램 및 지도에서 시각적 질문에 답변하는 등 다양한 비즈니스 이미지를 필요로 하는 MMMU(74.8%)와 같은 업계 최고의 이미지 이해 벤치마크를 제공합니다. 이 모든 모델은 Snowflake 환경 내에서 바로 작동하며, 복잡한 외부 통합이 전혀 필요하지 않습니다.
유연한 오디오 스크립팅: Cortex AI의 네이티브 멀티 모달 기능과 별도로 고객은 오디오 처리를 포함한 모든 모듈을 Snowpark Container Services를 통해 Snowflake로 가져올 수 있습니다. Snowpark Container Services는 개발자가 오디오 녹취 모델을 대규모로 배포할 수 있도록 컨테이너화 애플리케이션을 위한 관리형 인프라를 제공합니다.
Snowpark Container Services를 사용하면 특정 요구 사항에 따라 Snowflake에서 OpenAI Whisper, NVIDIA Canary 또는 NVIDIA Parakeet와 같은 모델을 배포하고 최적화할 수 있는 유연성을 누릴 수 있습니다. 고객은 종종 단어 오류율(WER)을 기반으로 선호 모델을 선택하지만, 다국어 지원과 같은 개별 모델 기능, 콜 센터와 같은 까다로운 환경에서의 성능 또는 리소스 효율성에 기반을 두기도 합니다. 사용자는 Snowflake의 안전하고 효율적인 환경에서 원하는 모델을 선택하여 실행할 수 있으며, 이는 유연성, 성능 및 신뢰성 측면에서 큰 이점을 제공합니다.
최신 엔터티 감성 분석: Cortex AI는 오디오 처리에서 그치지 않고, 다양한 텍스트 소스에서 인사이트를 도출하기 위한 정교한 텍스트 분석 기능도 제공합니다. 녹취된 고객 대화, 소셜 미디어 게시물, 제품 후기, 그 외 텍스트 데이터를 분석하는 과정에서 Snowflake의 최첨단 엔터티 감성 분석 기능은 표현된 의견의 미묘한 뉘앙스까지 정확히 파악할 수 있도록 지원합니다.
Snowflake의 관점 기반 감성 분석은 업계의 새로운 품질 표준을 제시하며, 아래에 언급된 벤치마크를 기준으로 볼 때, 선도적인 대규모 언어 모델(LLM)보다 뛰어난 감성 분류 능력을 제공합니다. 특히, Cortex AI Entity_Sentiment는 단순히 긍정적 또는 부정적이라는 포괄적인 분류에 의존하지 않고, 특정 개체에 대한 감정을 분석하여 텍스트에서 미묘하고 깊이 있는 인사이트를 추출합니다. Cortex AI Entity Sentiment는 GPT-4o와 같은 대형 모델을 프롬프트하는 것보다 최대 45% 더 비용 효율적이며 상당히 높은 감성 정확도를 제공합니다. 또한, 복합적이거나 불분명한 감정과 같은 복잡한 감정 표현을 효과적으로 처리하여 제품 후기나 통화 녹취록에서 상대적인 감정을 쉽게 분석할 수 있도록 지원합니다.

OCR을 사용한 고급 문서 처리: 조직은 디지털 소스의 텍스트뿐만 아니라 다양한 형식의 문서에서도 귀중한 정보를 추출해야 합니다. Cortex AI의 문서 처리 기능은 비정형 문서를 검색 가능하고 분석 가능한 데이터로 변환시켜 줍니다. 정확한 검색 시스템과 멀티 모달 분석을 위해서는 신뢰할 수 있는 텍스트 추출이 필수적이며, 이는 정확한 문서 처리의 가장 기본적인 요소입니다.
Cortex AI의 PARSE_DOCUMENT OCR 기능은 불필요한 복잡성을 더하지 않으면서도, 엔터프라이즈 문서에서 흔히 쓰이는 상용 및 오픈 소스 솔루션보다 뛰어난 성능을 제공합니다. 고객은 금융 문서에 대한 LLM 기반 질문 답변과 같은 OCR 결과를 애플리케이션에 쉽게 통합할 수 있습니다. Snowflake 솔루션은 ANLS 지표 기준 0.974로, 경쟁 솔루션(0.969)보다 훨씬 나은 결과를 제공합니다.

동급 최강의 기계 번역: 모든 디지털 텍스트와 문서에서 추출된 텍스트 대해 조직은 여러 언어로 정보를 액세스할 수 있도록 지원해야 하는 경우가 많습니다. Cortex AI Translate는 14개 언어에 걸쳐 고품질의 일관된 번역을 제공합니다. 일반적 용도로 사용되는 LLM과는 달리, Cortex AI Translate는 엄격한 데이터 준비 프로세스와 맞춤형 모델 훈련을 통해 번역 작업에 특별히 최적화되어 있습니다. 또한 그 성능은 산업 벤치마크로 널리 사용되는 상용 시스템 및 GPT-4o와 같은 최첨단 LLM과 비슷한 수준입니다. 동시에, Cortex AI Translate는 GPT-4o와 같은 대형 모델을 프롬프트하는 것보다 최대 51% 더 비용 효율적이며, 인기 있는 상용 시스템과 비교해서는 최대 70% 더 비용 효율적입니다. 아울러 Cortex AI Translate는 노이즈가 많은 텍스트, 코드 혼용, 확장된 컨텍스트를 일관성 있게 효과적으로 처리합니다.

통합 데이터 분석의 미래
Snowflake Cortex AI는 엔터프라이즈가 모든 데이터에서 가치를 추출하는 방법을 개선합니다. Cortex AI Complete Multimodal을 통해 정형 및 비정형 분석을 통합하고, 이 모든 작업은 Snowflake 내에서 SQL을 사용하여 이뤄집니다. 따라서 복잡성이 줄어들고 인사이트 확보 시간이 단축됩니다. 네이티브 AI와 신뢰할 수 있는 거버넌스를 통해 엔터프라이즈는 모든 데이터를 보다 풍부하고 광범위하게 이해할 수 있습니다. 이러한 통합 접근 방식은 더 빠르고 영향력 있는 의사 결정으로 이어집니다. Snowflake AI 연구 팀은 Cortex AI Complete Multimodal과 같이 혁신적인 기술과 업계 최고 수준의 품질에 최적화된 강력한 태스크 특화 함수를 통해 엔터프라이즈의 AI 가치 실현을 간소화합니다.
지금 바로 Snowflake Cortex AI Complete Multimodal을 확인해 보세요.
시작하기:
Snowflake의 멀디 모달 분석 Quickstart를 통해 비정형 데이터 처리에 대해 자세히 알아보세요.
보다 자세한 정보는 설명서 페이지에서 확인하실 수 있습니다.
미래 전망 진술
이 페이지에는 당사의 향후 제품 제공에 대한 미래 전망 진술이 포함되어 있으며, 이는 제품 제공에 대한 보장이 아닙니다. 실제 결과 및 제공 내용은 다를 수 있으며, 알려지거나 알려지지 않은 위험 및 불확실성에 영향을 받을 수 있습니다. 자세한 내용은 최신 10-Q를 참조하세요.