Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
estou a construir neste espaço há anos e segui o nishkarsh durante anos também - parabéns pelo lançamento!
como isto está no mesmo espaço em que estamos a construir, mergulhei fundo e tenho algumas reflexões.
o lançamento em si é muito hype-y e destina-se a provocar rage bait.
1. está posicionado como uma base de dados, mas é quase um sistema semelhante ao @supermemory.
2. o exemplo deles de "bancos de dados vetoriais" não conseguirem fazer isso, é realmente uma questão de "modelos de incorporação". e os modelos de incorporação têm superposições, são baratos e conseguem facilmente inferir diferenças entre eles. não é difícil pedir ao claude para fazer um mini experimento para provar isso (anexado abaixo).
O que importa é: consegue acompanhar como o conhecimento evolui? o tempo passa?
isto despertou a minha curiosidade, então li o artigo deles.
3. o artigo de pesquisa deles está a codificar e a manipular o benchmark com diferentes prompts para cada categoria!!! (veja a imagem abaixo). Se o benchmarking deles for fixo, o supermemory continuará a ser o SOTA.
4. reinventaram o artigo de recuperação contextual da Anthropic de 2024 e chamaram-lhe "o paradoxo do pronome órfão".
5. mencionam que usam um "armazenamento vetorial em memória" personalizado = a cerca de 500GB, você terá que pagar mais de $10k apenas pela RAM.
6. a inferência é executada muitas vezes no pipeline - o que significa que para cada token LLM que você ingere, acabará por pagar 5x mais do que o custo do token para o gráfico + contextualização + armazenamento.
7. os números de latência e custo nunca foram reportados. O meu palpite é que, devido à arquitetura, a latência terá dificuldades em escalar. mas não posso afirmar - o produto deles está atrás de um portão de demonstração.
8. o código de benchmarking não é OSS (pelo que posso perceber). não é replicável + quem sabe quanto contexto estão a injetar no modelo? qual é o K?
9. anúncios inorgânicos e não divulgados (basta ler os tweets citados). contas de influenciadores com mais de 400k seguidores a dizerem todos a mesma coisa. as pessoas continuam a escapar com isso @nikitabier lol
eu estou totalmente a favor de uma competição saudável e progresso nestes campos, gosto de ver um bom trabalho a ser feito por outros.
mas é fácil apenas dizer coisas. "ninguém vai verificar." jogar o jogo da maneira certa é difícil, e todos estão apenas a dizer o que podem para impressionar as pessoas....


Top
Classificação
Favoritos
