Llano, segunda entrada da AMD em sua família de processadores de fusão que combinam uma CPU e GPU no mesmo chip, lançado no início deste mês para comentários moderadamente positiva. Mas até agora, pouco se sabia detalhes sobre exatamente como a AMD tinha manipulado a integração do CPU e GPU em Llano de morrer.
David Kanter em RealWorldTech fez alguma escavação e montar um olhar em profundidade em Llano, comparando o seu CPU / GPU integração à de Ponte da Intel Sandy. Pedaço de Kanter responde a algumas perguntas sobre Llano que foram levantadas pelos comentários.
Além de seu núcleo CPU fraca, o Llano principal lacuna que as revisões destaque é o fato de que o núcleo GPU do processador é incrivelmente limitada pela largura de banda de memória. A GPU Cypress que é usado para Llano foi projetado para uma placa gráfica discreta, onde teria acesso a um gigabyte ou duas de alta largura de banda, memória dedicada GDDR. Em Llano, em contraste, as ações GPU memória principal com a CPU, eo resultado foi que o desempenho foi um gargalo severamente. Kanter artigo dá algumas dicas sobre o porquê disso.
Em vez de ligar CPU e GPU Llano com alta largura de banda de ônibus circular e deixá-los compartilhar um cache L3 (a abordagem Sandy Bridge), a AMD deixou as duas partes relativamente desconectados internamente. Em vez disso, a CPU e GPU uso de memória principal para se comunicar sem copiar dados de um local para o outro. Na inicialização, a GPU tem acesso a 512 MB de memória principal em um espaço de memória separado, a CPU fica o resto da RAM.
Internamente, há um pequeno autocarro bidirecional que conecta o GPU para conjunto de filas de memória coerente, e não há outro ônibus que liga o GPU para o controlador de DDR, mas é isso. As conversas CPU para a GPU usando o driver de gráficos e memória principal, ea GPU pode falar com o CPU usando solicitações coerente para regiões especiais de memória, mas o último é bastante lento.
Ao todo, então, a falta de uma ligação de banda larga interna entre CPU e GPU, ea dependência de memória principal para a comunicação, significa que o desempenho Llano de gráficos é muito bonito asfixiado pelo controlador do chip DDR3 dual-channel.
Quanto ao futuro de Llano, eu tinha sugerido que a AMD pode considerar um conjunto de eDRAM que a CPU e GPU pode usar a memória compartilhada e on-die de comunicação, mas Kanter oferece uma alternativa mais viável para aumentar o desempenho de um processador de fusão futuro de gráficos: usar o chip 3D empilhando técnicas para colocar uma pequena quantidade de memória no mesmo pacote que o processador. A quantidade de memória não teria que ser muito, mesmo 256MB de alta largura de banda, memória de baixa latência seria aumentar dramaticamente o desempenho de Llano.
Tudo isso, mais uma vez, mostra o quão grande de um bind NVIDIA é agora, e porque a empresa tem de fazer uma tentativa no espaço de trabalho com o Projeto Denver. Sandy Bridge e Fusão significar o começo do fim para o mercado de GPU, que ainda é o pão da NVIDIA e manteiga.
Leia os comentários deste post
Nenhum comentário:
Postar um comentário