Sveriges mest populära poddar
Microsoft Research Podcast

Abstracts: NeurIPS 2024 with Jindong Wang and Steven Euijong Whang

12 min13 december 2024

Researcher Jindong Wang and Associate Professor Steven Euijong Whang explore the NeurIPS 2024 work ERBench. ERBench leverages relational databases to create LLM benchmarks that can verify model rationale via keywords in addition to checking answer correctness. 

Read the paper

Get datasets and codes

Fler avsnitt av Microsoft Research Podcast

Visa alla avsnitt av Microsoft Research Podcast

Microsoft Research Podcast med Researchers across the Microsoft research community finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.