IBM Granite 3.2, zorlu kurumsal kullanım durumlarını ele almak için koşullu akıl yürütme, zaman serisi tahmini ve belge vizyonunu kullanır

Sektör lideri AI kapsamı hakkında en son güncellemeler ve özel içerikler için günlük ve haftalık bültenlerimize katılın. Daha Fazla Bilgi Edinin
DeepSeek-R1'in çığır açan çıkışının ardından, 2025'te akıl yürütme modelleri şu ana kadar çok popüler oldu.
IBM, bugün Granite 3.2 büyük dil modeli (LLM) ailesinin lansmanıyla partiye katılıyor. DeepSeek-R1 veya OpenAI'nin o3'ü gibi diğer akıl yürütme yaklaşımlarının aksine IBM, akıl yürütmeyi temel açık kaynaklı Granite modellerine derinlemesine yerleştiriyor. IBM'in koşullu akıl yürütme olarak adlandırdığı bir yaklaşımdır; burada adım adım düşünce zinciri (CoT) akıl yürütmesi, modeller içinde bir seçenektir (ayrı bir model olmaktan ziyade).
Bu, akıl yürütmenin bir bayrakla koşullu olarak etkinleştirilebildiği ve kullanıcıların daha yoğun işlemleri ne zaman kullanacaklarını kontrol etmelerine olanak tanıyan esnek bir yaklaşımdır. Yeni akıl yürütme yeteneği, IBM'in Aralık 2024'te Granite 3.1 LLM'lerinin piyasaya sürülmesiyle tanıttığı performans kazanımlarına dayanmaktadır.
IBM ayrıca Granite 3.2 ailesinde belge işleme için özel olarak optimize edilmiş yeni bir vizyon modeli yayınlıyor. Model, birçok büyük kuruluşun mücadele ettiği bir zorluk olan eski belgeleri dijitalleştirmek için özellikle yararlıdır.
IBM'in Granite 3.2 ile çözmeyi hedeflediği bir diğer kurumsal AI zorluğu ise öngörücü modellemedir. Makine öğrenimi (ML) onlarca yıldır tahminler için kullanılıyordu ancak modern nesil AI'nın doğal dil arayüzüne ve kullanım kolaylığına sahip değildi. IBM'in Granite zaman serisi tahmin modelleri tam da burada devreye giriyor; zaman tabanlı verilerden gelecekteki değerleri tahmin etmek için dönüştürücü teknolojisini uyguluyorlar.
IBM Araştırma'da Yapay Zeka Modelleri Başkan Yardımcısı David Cox, VentureBeat'e yaptığı açıklamada, "Muhakeme, bir modelin yaptığı bir şey değil, bir modelin yaptığı bir şeydir" dedi.
2025 yılında akıl yürütme modelleri etrafında heyecan ve ilgi eksikliği yaşanmasa da, akıl yürütmenin tek başına kurumsal kullanıcılara mutlaka değer sağladığı söylenemez.
Birçok açıdan akıl yürütme yeteneği uzun zamandır gen AI'nın bir parçası olmuştur. Bir LLM'yi adım adım bir yaklaşımla cevaplamaya yönlendirmek, temel bir CoT akıl yürütme çıktısını tetikler. DeepSeek-R1 ve şimdi Granite 3.2 gibi modellerdeki modern akıl yürütme, akıl yürütme yeteneklerini eğitmek ve etkinleştirmek için takviyeli öğrenmeyi kullanarak biraz daha derine iner.
CoT istemleri matematik gibi belirli görevler için etkili olabilirken, Granite 3.2'deki muhakeme yetenekleri daha geniş bir kurumsal uygulama yelpazesine fayda sağlayabilir. Cox, modelin daha fazla zamanını düşünmeye harcamasını teşvik ederek, işletmelerin karmaşık karar alma süreçlerini iyileştirebileceğini belirtti. Muhakeme, yazılım mühendisliği görevleri, BT sorun çözümü ve modelin sorunları parçalara ayırabileceği, daha iyi kararlar alabileceği ve daha bilgili çözümler önerebileceği diğer aracı iş akışlarına fayda sağlayabilir.
IBM ayrıca, muhakeme açıldığında Granite 3.2'nin, DeepSeek-R1 de dahil olmak üzere, talimat izleme görevlerinde rakiplerinden daha iyi performans gösterebildiğini iddia ediyor.
Granite 3.2 gelişmiş muhakeme yeteneklerine sahip olsa da Cox, her sorgunun aslında daha fazla muhakemeye ihtiyaç duymadığını vurguladı. Aslında, birçok yaygın sorgu türü daha fazla muhakemeyle olumsuz etkilenebilir.
Örneğin, bilgiye dayalı bir sorgu için, DeepSeek-R1 gibi bağımsız bir akıl yürütme modeli, "Roma Nerede?" gibi temel bir soruyu yanıtlamak için dahili bir monologa 50 saniyeye kadar zaman harcayabilir.
Granite 3.2'deki temel yeniliklerden biri, geliştiricilerin modelin akıl yürütme yeteneklerini dinamik olarak etkinleştirmesine veya devre dışı bırakmasına olanak tanıyan koşullu düşünme özelliğinin sunulmasıdır. Bu esneklik, kullanıcıların eldeki belirli göreve bağlı olarak hız ve analiz derinliği arasında bir denge kurmasını sağlar.
Bir adım daha ileri giderek, Granite 3.2 modelleri, daha esnek muhakeme yeteneklerini etkinleştirmek için "parçacık filtresi" adı verilen bir şeyi kullanan IBM'in Red Hat iş birimi tarafından geliştirilen bir yöntemden yararlanıyor.
Bu yaklaşım, modelin birden fazla akıl yürütme dizisini dinamik olarak kontrol etmesine ve yönetmesine, nihai sonuca ulaşmak için hangilerinin en umut verici olduğunu değerlendirmesine olanak tanır. Bu, doğrusal bir CoT'den ziyade daha dinamik ve uyarlanabilir bir akıl yürütme süreci sağlar. Cox, bu parçacık filtresi tekniğinin işletmelere modelin akıl yürütme yeteneklerini nasıl kullanabilecekleri konusunda daha da fazla esneklik sağladığını açıkladı.
Parçacık filtresi yaklaşımında, aynı anda gerçekleşen birçok akıl yürütme dizisi vardır. Parçacık filtresi, daha az etkili yaklaşımları budayarak daha iyi sonuçlar sağlayanlara odaklanır. Yani, sadece CoT akıl yürütmesi yapmak yerine, bir sorunu çözmek için birden fazla yaklaşım vardır. Model, karmaşık sorunları akıllıca yönlendirebilir ve seçici olarak en umut verici akıl yürütme hatlarına odaklanabilir.
Büyük organizasyonlar genellikle eşit miktarda büyük belgeye sahip olma eğilimindedir, bunların çoğu yıllar önce taranmış ve şimdi arşivlerde durmaktadır. Tüm bu verilerin modern sistemlerle kullanımı zor olmuştur.
Yeni Granite 3.2 vizyon modeli, bu kurumsal zorluğun çözülmesine yardımcı olmak için tasarlanmıştır. Birçok çok modlu model genel görüntü anlayışına odaklanırken, Granite 3.2'nin vizyon yetenekleri özellikle belge işleme için tasarlanmıştır; bu da IBM'in kıyaslama puanlarını kovalamak yerine somut kurumsal sorunları çözmeye odaklanmasını yansıtır.
Sistem, Cox'un "mantıksız miktarda eski taranmış belge" olarak tanımladığı, özellikle finansal kurumlarda kurumsal arşivlerde bulunanları hedef alıyor. Bunlar, potansiyel iş değerlerine rağmen büyük ölçüde dokunulmamış, opak veri depolarını temsil ediyor.
Onlarca yıllık kağıt kayıtlarına sahip kuruluşlar için, grafikler, şekiller ve tablolar içeren belgeleri akıllıca işleme yeteneği, tatil fotoğraflarını tanımlamada mükemmel olan ancak yapılandırılmış iş belgelerinde zorluk çeken genel amaçlı çok biçimli modellere kıyasla önemli bir operasyonel avantaj sağlar.
IBM Granite vision 3.2, DocVQA ve ChartQA gibi kurumsal kıyaslamalarda rakiplerine karşı güçlü sonuçlar ortaya koyuyor.
Sürümün teknik açıdan en ayırt edici bileşeni belki de IBM'in "küçük zaman karıştırıcıları" (TTM) - özellikle zaman serisi tahmini için tasarlanmış, özel dönüştürücü tabanlı modeller.
Ancak, öngörücü analiz ve modellemeye olanak tanıyan zaman serisi tahmini yeni değildir. Cox, çeşitli nedenlerle zaman serisi modellerinin makine öğreniminin (ML) eski çağında takılıp kaldığını ve daha yeni, daha gösterişli nesil AI modellerinin aynı ilgisinden yararlanmadığını belirtti.
Granite TTM modelleri, LLM ilerlemelerini destekleyen mimari yenilikleri tamamen farklı bir sorun alanına uygular: Tarihsel kalıplara dayalı gelecekteki değerleri tahmin etme. Bu yetenek, finansal tahmin, ekipman bakım planlaması ve anormallik tespiti genelindeki kritik iş ihtiyaçlarını ele alır.
Çok fazla abartı var ve satıcılar, endüstri ölçütlerinin sonsuz çeşitliliğinde birbirlerini geride bırakacaklarını iddia ediyorlar.
Kurumsal karar vericiler için kıyaslamalara dikkat etmek ilginç olabilir, ancak bu, sorun noktalarını çözen şey değildir. Cox, IBM'in kurumsal AI'ya 'takım elbise ve kravat' yaklaşımını benimsediğini ve gerçek sorunları çözmeyi amaçladığını vurguladı.
Cox, "Bence ihtiyacımız olan her şeyi bir şekilde yapacak süper zeki bir modele sahip olabileceğimiz konusunda çok fazla büyülü düşünce gerçekleşiyor ve en azından şimdilik buna yakın bile değiliz," dedi. "Stratejimiz 'Bu heyecan verici teknolojiyi kullanarak gerçek, pratik araçlar inşa edelim ve gerçek işi yapmayı kolaylaştıran mümkün olduğunca çok sayıda özelliği inşa edelim."
Patronunuzu etkilemek istiyorsanız, VB Daily sizin için burada. Şirketlerin üretken yapay zeka ile ilgili olarak düzenleyici değişikliklerden pratik dağıtımlara kadar neler yaptıklarına dair içeriden bilgiler veriyoruz, böylece maksimum yatırım getirisi için içgörüler paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkürler. Daha fazla VB bültenine buradan göz atın.
Bir hata oluştu.

venturebeat