quinta-feira, 30 de junho de 2011

Porque a memória é o elo mais fraco em chips da AMD mais recentes de fusão

Notícias interessantes sobre o url:http://feeds.arstechnica.com/~r/arstechnica/everything/~3/SiW2M9M0onE/another-look-at-amds-llano.ars:


Llano, segunda entrada da AMD em sua família de processadores de fusão que combinam uma CPU e GPU no mesmo chip, lançado no início deste mês para comentários moderadamente positiva. Mas até agora, pouco se sabia detalhes sobre exatamente como a AMD tinha manipulado a integração do CPU e GPU em Llano de morrer.


David Kanter em RealWorldTech fez alguma escavação e montar um olhar em profundidade em Llano, comparando o seu CPU / GPU integração à de Ponte da Intel Sandy. Pedaço de Kanter responde a algumas perguntas sobre Llano que foram levantadas pelos comentários.


Além de seu núcleo CPU fraca, o Llano principal lacuna que as revisões destaque é o fato de que o núcleo GPU do processador é incrivelmente limitada pela largura de banda de memória. A GPU Cypress que é usado para Llano foi projetado para uma placa gráfica discreta, onde teria acesso a um gigabyte ou duas de alta largura de banda, memória dedicada GDDR. Em Llano, em contraste, as ações GPU memória principal com a CPU, eo resultado foi que o desempenho foi um gargalo severamente. Kanter artigo dá algumas dicas sobre o porquê disso.


Em vez de ligar CPU e GPU Llano com alta largura de banda de ônibus circular e deixá-los compartilhar um cache L3 (a abordagem Sandy Bridge), a AMD deixou as duas partes relativamente desconectados internamente. Em vez disso, a CPU e GPU uso de memória principal para se comunicar sem copiar dados de um local para o outro. Na inicialização, a GPU tem acesso a 512 MB de memória principal em um espaço de memória separado, a CPU fica o resto da RAM.


Internamente, há um pequeno autocarro bidirecional que conecta o GPU para conjunto de filas de memória coerente, e não há outro ônibus que liga o GPU para o controlador de DDR, mas é isso. As conversas CPU para a GPU usando o driver de gráficos e memória principal, ea GPU pode falar com o CPU usando solicitações coerente para regiões especiais de memória, mas o último é bastante lento.


Ao todo, então, a falta de uma ligação de banda larga interna entre CPU e GPU, ea dependência de memória principal para a comunicação, significa que o desempenho Llano de gráficos é muito bonito asfixiado pelo controlador do chip DDR3 dual-channel.


Quanto ao futuro de Llano, eu tinha sugerido que a AMD pode considerar um conjunto de eDRAM que a CPU e GPU pode usar a memória compartilhada e on-die de comunicação, mas Kanter oferece uma alternativa mais viável para aumentar o desempenho de um processador de fusão futuro de gráficos: usar o chip 3D empilhando técnicas para colocar uma pequena quantidade de memória no mesmo pacote que o processador. A quantidade de memória não teria que ser muito, mesmo 256MB de alta largura de banda, memória de baixa latência seria aumentar dramaticamente o desempenho de Llano.


Tudo isso, mais uma vez, mostra o quão grande de um bind NVIDIA é agora, e porque a empresa tem de fazer uma tentativa no espaço de trabalho com o Projeto Denver. Sandy Bridge e Fusão significar o começo do fim para o mercado de GPU, que ainda é o pão da NVIDIA e manteiga.


Leia os comentários deste post




Nenhum comentário:

Postar um comentário