ປ້າຍໂຄສະນາກໍລະນີ

ຂ່າວອຸດສາຫະກໍາ: Jim Keller ໄດ້ເປີດຕົວຊິບ RISC-V ໃຫມ່

ຂ່າວອຸດສາຫະກໍາ: Jim Keller ໄດ້ເປີດຕົວຊິບ RISC-V ໃຫມ່

ບໍລິສັດຊິບທີ່ນໍາພາໂດຍ Jim Keller Tenstorrent ໄດ້ປ່ອຍໂປເຊດເຊີ Wormhole ລຸ້ນຕໍ່ໄປຂອງຕົນສໍາລັບການເຮັດວຽກຂອງ AI, ເຊິ່ງມັນຄາດວ່າຈະສະຫນອງການປະຕິບັດທີ່ດີໃນລາຄາທີ່ເຫມາະສົມ.ໃນປັດຈຸບັນບໍລິສັດໄດ້ສະເຫນີສອງບັດ PCIe ເພີ່ມເຕີມທີ່ສາມາດຮອງຮັບຫນຶ່ງຫຼືສອງໂປເຊດເຊີ Wormhole, ເຊັ່ນດຽວກັນກັບສະຖານີເຮັດວຽກ TT-LoudBox ແລະ TT-QuietBox ສໍາລັບນັກພັດທະນາຊອບແວ. ທຸກໆການປະກາດໃນມື້ນີ້ແມ່ນແນໃສ່ນັກພັດທະນາ, ບໍ່ແມ່ນຜູ້ທີ່ໃຊ້ກະດານ Wormhole ສໍາລັບວຽກງານການຄ້າ.

“ມັນຮູ້ສຶກດີໃຈສະເໝີທີ່ໄດ້ເອົາຜະລິດຕະພັນຂອງພວກເຮົາເຂົ້າມາໃນມືຂອງນັກພັດທະນາ. ປ່ອຍລະບົບການພັດທະນາໂດຍໃຊ້ບັດ Wormhole™ ຂອງພວກເຮົາສາມາດຊ່ວຍໃຫ້ນັກພັດທະນາຂະຫຍາຍແລະພັດທະນາຊອບແວ AI ຫຼາຍຊິບ,” Jim Keller, CEO ຂອງ Tenstorrent ກ່າວ.ນອກເຫນືອຈາກການເປີດຕົວນີ້, ພວກເຮົາຕື່ນເຕັ້ນທີ່ຈະເຫັນຄວາມຄືບຫນ້າທີ່ພວກເຮົາກໍາລັງເຮັດດ້ວຍການອອກເທບແລະການເພີ່ມພະລັງງານຂອງຜະລິດຕະພັນຮຸ່ນທີສອງຂອງພວກເຮົາ, Blackhole.”

1

ແຕ່ລະໂປເຊດເຊີ Wormhole ມີ 72 Tensix cores (ຫ້າອັນທີ່ສະຫນັບສະຫນູນ RISC-V cores ໃນຮູບແບບຂໍ້ມູນຕ່າງໆ) ແລະ 108 MB ຂອງ SRAM, ສົ່ງ 262 FP8 TFLOPS ຢູ່ 1 GHz ດ້ວຍພະລັງງານການອອກແບບຄວາມຮ້ອນຂອງ 160W. ບັດ Wormhole n150 ຊິບດຽວມີຫນ່ວຍຄວາມຈໍາວິດີໂອ 12 GB GDDR6 ແລະມີແບນວິດ 288 GB / ວິນາທີ.

ໂປເຊດເຊີ Wormhole ສະຫນອງການຂະຫຍາຍທີ່ມີຄວາມຍືດຫຍຸ່ນເພື່ອຕອບສະຫນອງຄວາມຕ້ອງການທີ່ຫຼາກຫຼາຍຂອງວຽກ. ໃນການຕັ້ງຄ່າສະຖານີເຮັດວຽກມາດຕະຖານທີ່ມີສີ່ບັດ Wormhole n300, ໂປເຊດເຊີສາມາດຖືກລວມເຂົ້າກັນເປັນຫນ່ວຍດຽວທີ່ປາກົດຢູ່ໃນຊອບແວເປັນເຄືອຂ່າຍຫຼັກ Tensix ທີ່ມີເອກະພາບ, ກວ້າງ. ການຕັ້ງຄ່ານີ້ຊ່ວຍໃຫ້ຕົວເລັ່ງສາມາດຈັດການກັບວຽກດຽວກັນ, ແບ່ງອອກລະຫວ່າງຜູ້ພັດທະນາສີ່ຄົນຫຼືແລ່ນເຖິງແປດຕົວແບບ AI ທີ່ແຕກຕ່າງກັນພ້ອມກັນ. ຄຸນນະສົມບັດທີ່ສໍາຄັນຂອງການຂະຫຍາຍນີ້ແມ່ນວ່າມັນສາມາດດໍາເນີນການຢູ່ໃນທ້ອງຖິ່ນໂດຍບໍ່ຈໍາເປັນຕ້ອງສໍາລັບການ virtualization. ໃນສະພາບແວດລ້ອມສູນຂໍ້ມູນ, ໂປເຊດເຊີ Wormhole ຈະໃຊ້ PCIe ສໍາລັບການຂະຫຍາຍຕົວພາຍໃນເຄື່ອງ, ຫຼື Ethernet ສໍາລັບການຂະຫຍາຍພາຍນອກ.

ໃນດ້ານການປະຕິບັດ, ບັດ Wormhole n150 ຊິບດຽວຂອງ Tenstorrent (72 Tensix cores, ຄວາມຖີ່ 1 GHz, 108 MB SRAM, 12 GB GDDR6, ແບນວິດ 288 GB / s) ບັນລຸ 262 FP8 TFLOPS ທີ່ 160W, ໃນຂະນະທີ່ Wormhole-board ຄູ່. (128 Tensix cores, ຄວາມຖີ່ 1 GHz, 192 MB SRAM, ລວມ 24 GB GDDR6, ແບນວິດ 576 GB/s) ສົ່ງເຖິງ 466 FP8 TFLOPS ທີ່ 300W.

ເພື່ອເອົາ 300W ຂອງ 466 FP8 TFLOPS ເຂົ້າໄປໃນສະພາບການ, ພວກເຮົາຈະປຽບທຽບມັນກັບສິ່ງທີ່ຜູ້ນໍາຕະຫຼາດ AI ທີ່ Nvidia ສະເຫນີຢູ່ໃນພະລັງງານການອອກແບບຄວາມຮ້ອນນີ້. A100 ຂອງ Nvidia ບໍ່ຮອງຮັບ FP8, ແຕ່ມັນສະຫນັບສະຫນູນ INT8, ດ້ວຍປະສິດທິພາບສູງສຸດຂອງ 624 TOPS (1,248 TOPS ເມື່ອເບົາບາງ). ໃນການປຽບທຽບ, Nvidia's H100 ສະຫນັບສະຫນູນ FP8 ແລະບັນລຸປະສິດທິພາບສູງສຸດຂອງ 1,670 TFLOPS ທີ່ 300W (3,341 TFLOPS ຢູ່ sparse), ເຊິ່ງແຕກຕ່າງກັນຢ່າງຫຼວງຫຼາຍຈາກ Tenstorrent's Wormhole n300.

ຢ່າງໃດກໍຕາມ, ມີບັນຫາໃຫຍ່ຫນຶ່ງ. Wormhole n150 ຂອງ Tenstorrent ຂາຍໃນລາຄາ 999 ໂດລາ, ໃນຂະນະທີ່ n300 ຂາຍໃນລາຄາ 1,399 ໂດລາ. ໂດຍການປຽບທຽບ, ບັດກາຟິກ Nvidia H100 ດຽວຂາຍໃນລາຄາ 30,000 ໂດລາ, ຂຶ້ນກັບປະລິມານ. ແນ່ນອນ, ພວກເຮົາບໍ່ຮູ້ວ່າໂຮງງານຜະລິດ Wormhole ສີ່ຫຼືແປດຕົວສາມາດປະຕິບັດຕົວຈິງຂອງ H300 ດຽວ, ແຕ່ TDPs ຂອງພວກເຂົາແມ່ນ 600W ແລະ 1200W ຕາມລໍາດັບ.

ນອກເຫນືອຈາກບັດ, Tenstorrent ສະຫນອງພື້ນທີ່ເຮັດວຽກທີ່ສ້າງຂຶ້ນກ່ອນສໍາລັບນັກພັດທະນາ, ລວມທັງ 4 ບັດ n300 ໃນ Xeon-based TT-LoudBox ທີ່ມີລາຄາຖືກກວ່າທີ່ມີຄວາມເຢັນທີ່ມີການເຄື່ອນໄຫວ, ແລະ TT-QuietBox ຂັ້ນສູງທີ່ມີຟັງຊັນເຮັດຄວາມເຢັນຂອງແຫຼວທີ່ອີງໃສ່ Xiaolong).


ເວລາປະກາດ: 29-07-2024