Điều gì về các cuộc trò chuyện dựa trên giọng nói với LLM khiến chúng kém khả năng hơn? Nói chuyện với chúng thật tuyệt vời nhưng nếu bạn muốn nhập liệu hoặc tạo ra phương tiện thì đột nhiên chúng không thể làm điều đó Đó có phải là một trở ngại đã được biết đến trong nghiên cứu? Hay là không có đủ nhu cầu cho điều đó?