ບໍລິສັດຊິບ Tenstorrent ທີ່ນຳພາໂດຍ Jim Keller ໄດ້ເປີດຕົວໂປເຊດເຊີ Wormhole ລຸ້ນຕໍ່ໄປສຳລັບວຽກງານ AI ເຊິ່ງຄາດວ່າຈະໃຫ້ປະສິດທິພາບທີ່ດີໃນລາຄາທີ່ເໝາະສົມ.ປະຈຸບັນບໍລິສັດສະເໜີກາດ PCIe ເພີ່ມເຕີມສອງໜ່ວຍທີ່ສາມາດຮອງຮັບໂປເຊດເຊີ Wormhole ໜຶ່ງ ຫຼື ສອງໜ່ວຍ, ພ້ອມທັງສະຖານີເຮັດວຽກ TT-LoudBox ແລະ TT-QuietBox ສຳລັບນັກພັດທະນາຊອບແວ. ການປະກາດທັງໝົດໃນມື້ນີ້ແມ່ນແນໃສ່ນັກພັດທະນາ, ບໍ່ແມ່ນຜູ້ທີ່ໃຊ້ກະດານ Wormhole ສຳລັບວຽກງານທາງການຄ້າ.
“ມັນເປັນເລື່ອງທີ່ໜ້າພໍໃຈສະເໝີທີ່ໄດ້ເອົາຜະລິດຕະພັນຂອງພວກເຮົາໄປໄວ້ໃນມືຂອງນັກພັດທະນາຫຼາຍຂຶ້ນ. ການປ່ອຍລະບົບການພັດທະນາໂດຍໃຊ້ບັດ Wormhole™ ຂອງພວກເຮົາສາມາດຊ່ວຍໃຫ້ນັກພັດທະນາຂະຫຍາຍ ແລະ ພັດທະນາຊອບແວ AI ຫຼາຍຊິບໄດ້,” Jim Keller, CEO ຂອງ Tenstorrent ກ່າວ.ນອກເໜືອໄປຈາກການເປີດຕົວຄັ້ງນີ້, ພວກເຮົາຍັງຕື່ນເຕັ້ນທີ່ຈະເຫັນຄວາມຄືບໜ້າທີ່ພວກເຮົາກຳລັງເຮັດຢູ່ດ້ວຍການອອກເທບ ແລະ ການເພີ່ມພະລັງໃຫ້ກັບຜະລິດຕະພັນລຸ້ນທີສອງຂອງພວກເຮົາ, Blackhole.”
ໂປເຊດເຊີ Wormhole ແຕ່ລະໜ່ວຍປະກອບດ້ວຍ 72 ແກນ Tensix (ຫ້າແກນຮອງຮັບ RISC-V ໃນຮູບແບບຂໍ້ມູນຕ່າງໆ) ແລະ 108 MB ຂອງ SRAM, ສົ່ງ 262 FP8 TFLOPS ທີ່ 1 GHz ດ້ວຍພະລັງງານການອອກແບບຄວາມຮ້ອນ 160W. ກາດ Wormhole n150 ແບບຊິບດຽວມີໜ່ວຍຄວາມຈຳວິດີໂອ GDDR6 12 GB ແລະມີແບນວິດ 288 GB/s.
ໂປເຊດເຊີ Wormhole ໃຫ້ຄວາມສາມາດໃນການຂະຫຍາຍທີ່ມີຄວາມຍືດຫຍຸ່ນເພື່ອຕອບສະໜອງຄວາມຕ້ອງການທີ່ຫຼາກຫຼາຍຂອງປະລິມານວຽກ. ໃນການຕັ້ງຄ່າສະຖານີເຮັດວຽກມາດຕະຖານທີ່ມີກາດ Wormhole n300 ສີ່ໜ່ວຍ, ໂປເຊດເຊີສາມາດລວມເຂົ້າກັນເປັນໜ່ວຍດຽວທີ່ປາກົດຢູ່ໃນຊອບແວເປັນເຄືອຂ່າຍຫຼັກ Tensix ທີ່ກວ້າງຂວາງ ແລະ ເປັນເອກະພາບ. ການຕັ້ງຄ່ານີ້ຊ່ວຍໃຫ້ຕົວເລັ່ງຄວາມໄວສາມາດຈັດການກັບປະລິມານວຽກດຽວກັນ, ແບ່ງອອກລະຫວ່າງນັກພັດທະນາສີ່ຄົນ ຫຼື ແລ່ນຮູບແບບ AI ທີ່ແຕກຕ່າງກັນໄດ້ເຖິງແປດແບບພ້ອມໆກັນ. ຄຸນສົມບັດຫຼັກຂອງຄວາມສາມາດໃນການຂະຫຍາຍນີ້ແມ່ນວ່າມັນສາມາດແລ່ນຢູ່ໃນທ້ອງຖິ່ນໂດຍບໍ່ຕ້ອງການ virtualization. ໃນສະພາບແວດລ້ອມສູນຂໍ້ມູນ, ໂປເຊດເຊີ Wormhole ຈະໃຊ້ PCIe ສຳລັບການຂະຫຍາຍພາຍໃນເຄື່ອງ, ຫຼື Ethernet ສຳລັບການຂະຫຍາຍພາຍນອກ.
ໃນດ້ານປະສິດທິພາບ, ກາດ Wormhole n150 ຊິບດຽວຂອງ Tenstorrent (72 ແກນ Tensix, ຄວາມຖີ່ 1 GHz, 108 MB SRAM, 12 GB GDDR6, ແບນວິດ 288 GB/s) ບັນລຸໄດ້ 262 FP8 TFLOPS ທີ່ 160W, ໃນຂະນະທີ່ກະດານ Wormhole n300 ຄູ່ (128 ແກນ Tensix, ຄວາມຖີ່ 1 GHz, 192 MB SRAM, ລວມ 24 GB GDDR6, ແບນວິດ 576 GB/s) ສົ່ງໄດ້ເຖິງ 466 FP8 TFLOPS ທີ່ 300W.
ເພື່ອເອົາ 300W ຂອງ 466 FP8 TFLOPS ເຂົ້າໃສ່ສະພາບການ, ພວກເຮົາຈະປຽບທຽບມັນກັບສິ່ງທີ່ຜູ້ນຳຕະຫຼາດ AI Nvidia ສະເໜີໃຫ້ດ້ວຍພະລັງການອອກແບບຄວາມຮ້ອນນີ້. A100 ຂອງ Nvidia ບໍ່ຮອງຮັບ FP8, ແຕ່ມັນຮອງຮັບ INT8, ດ້ວຍປະສິດທິພາບສູງສຸດ 624 TOPS (1,248 TOPS ເມື່ອມີພະລັງງານໜ້ອຍ). ເມື່ອປຽບທຽບກັນແລ້ວ, H100 ຂອງ Nvidia ຮອງຮັບ FP8 ແລະບັນລຸປະສິດທິພາບສູງສຸດ 1,670 TFLOPS ທີ່ 300W (3,341 TFLOPS ເມື່ອມີພະລັງງານໜ້ອຍ), ເຊິ່ງແຕກຕ່າງຈາກ Wormhole n300 ຂອງ Tenstorrent ຢ່າງຫຼວງຫຼາຍ.
ເຖິງຢ່າງໃດກໍ່ຕາມ, ມີບັນຫາໃຫຍ່ຢູ່ຢ່າງໜຶ່ງ. Wormhole n150 ຂອງ Tenstorrent ຂາຍໃນລາຄາ 999 ໂດລາ, ໃນຂະນະທີ່ n300 ຂາຍໃນລາຄາ 1,399 ໂດລາ. ເມື່ອປຽບທຽບກັນແລ້ວ, ກາດກຣາບຟິກ Nvidia H100 ອັນດຽວຂາຍໃນລາຄາ 30,000 ໂດລາ, ຂຶ້ນກັບປະລິມານ. ແນ່ນອນ, ພວກເຮົາບໍ່ຮູ້ວ່າໂປເຊດເຊີ Wormhole ສີ່ຫຼືແປດໂຕສາມາດສົ່ງມອບປະສິດທິພາບຂອງ H300 ດຽວໄດ້ແທ້ຫຼືບໍ່, ແຕ່ TDP ຂອງມັນແມ່ນ 600W ແລະ 1200W ຕາມລຳດັບ.
ນອກເໜືອໄປຈາກບັດຕ່າງໆ, Tenstorrent ຍັງມີສະຖານີເຮັດວຽກທີ່ສ້າງໄວ້ລ່ວງໜ້າສຳລັບນັກພັດທະນາ, ລວມທັງບັດ n300 4 ອັນໃນ TT-LoudBox ທີ່ອີງໃສ່ Xeon ທີ່ມີລາຄາຖືກກວ່າພ້ອມດ້ວຍລະບົບລະບາຍຄວາມຮ້ອນແບບ active cooling, ແລະ TT-QuietBox ທີ່ກ້າວໜ້າພ້ອມດ້ວຍຟັງຊັນລະບາຍຄວາມຮ້ອນດ້ວຍນ້ຳ Xiaolong ທີ່ອີງໃສ່ EPYC.
ເວລາໂພສ: ກໍລະກົດ-29-2024
