Blame - docs/AMDGPUOperandSyntax.rst - platform_external_llvm

2018-12-17 17:38:11 +0000

[diff] [blame]

1

=====================================

2

Syntax of AMDGPU Instruction Operands

3

=====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

.. contents::

:local:

Conventions

===========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

11

The following notation is used throughout this document:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

12

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

13

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

14

Notation Description

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

15

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

16

{0..N} Any integer value in the range from 0 to N (inclusive).

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

17

<x> Syntax and meaning of *x* is explained elsewhere.

18

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

19

20

.. _amdgpu_syn_operands:

Operands

========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

25

.. _amdgpu_synid_v:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

26

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

27

v

28

-

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

29

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

30

Vector registers. There are 256 32-bit vector registers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

31

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

32

A sequence of *vector* registers may be used to operate with more than 32 bits of data.

33

34

Assembler currently supports sequences of 1, 2, 3, 4, 8 and 16 *vector* registers.

35

36

=================================================== ====================================================================

37

Syntax Description

38

=================================================== ====================================================================

39

**v**\<N> A single 32-bit *vector* register.

40

41

*N* must be a decimal integer number.

42

**v[**\ <N>\ **]** A single 32-bit *vector* register.

43

44

*N* may be specified as an

45

:ref:`integer number<amdgpu_synid_integer_number>`

46

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

47

**v[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

48

49

*N* and *K* may be specified as

50

:ref:`integer numbers<amdgpu_synid_integer_number>`

51

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

52

**[v**\ <N>, \ **v**\ <N+1>, ... **v**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

53

54

Register indices must be specified as decimal integer numbers.

55

=================================================== ====================================================================

56

57

Note. *N* and *K* must satisfy the following conditions:

* *N* <= *K*.

* 0 <= *N* <= 255.

* 0 <= *K* <= 255.

* *K-N+1* must be equal to 1, 2, 3, 4, 8 or 16.

63

64

Examples:

65

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

66

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

v255

v[0]

v[0:1]

v[1:1]

v[0:3]

v[2*2]

v[1-1:2-1]

[v252]

[v252,v253,v254,v255]

.. _amdgpu_synid_s:

s

-

Scalar 32-bit registers. The number of available *scalar* registers depends on GPU:

84

85

======= ============================

86

GPU Number of *scalar* registers

87

======= ============================

GFX7 104

GFX8 102

GFX9 102

======= ============================

92

93

A sequence of *scalar* registers may be used to operate with more than 32 bits of data.

94

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *scalar* registers.

95

96

Pairs of *scalar* registers must be even-aligned (the first register must be even).

97

Sequences of 4 and more *scalar* registers must be quad-aligned.

98

99

======================================================== ====================================================================

100

Syntax Description

101

======================================================== ====================================================================

102

**s**\ <N> A single 32-bit *scalar* register.

103

104

*N* must be a decimal integer number.

105

**s[**\ <N>\ **]** A single 32-bit *scalar* register.

106

107

*N* may be specified as an

108

:ref:`integer number<amdgpu_synid_integer_number>`

109

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

110

**s[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

111

112

*N* and *K* may be specified as

113

:ref:`integer numbers<amdgpu_synid_integer_number>`

114

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

115

**[s**\ <N>, \ **s**\ <N+1>, ... **s**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

116

117

Register indices must be specified as decimal integer numbers.

118

======================================================== ====================================================================

119

120

Note. *N* and *K* must satisfy the following conditions:

121

122

* *N* must be properly aligned based on sequence size.

123

* *N* <= *K*.

124

* 0 <= *N* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

125

* 0 <= *K* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

126

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

127

128

Examples:

129

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

130

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

s0

s[0]

s[0:1]

s[1:1]

s[0:3]

s[2*2]

s[1-1:2-1]

[s4]

[s4,s5,s6,s7]

Examples of *scalar* registers with an invalid alignment:

143

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

144

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

s[1:2]

s[2:5]

.. _amdgpu_synid_trap:

trap

----

A set of trap handler registers:

155

156

* :ref:`ttmp<amdgpu_synid_ttmp>`

157

* :ref:`tba<amdgpu_synid_tba>`

158

* :ref:`tma<amdgpu_synid_tma>`

159

160

.. _amdgpu_synid_ttmp:

ttmp

----

Trap handler temporary scalar registers, 32-bits wide.

166

The number of available *ttmp* registers depends on GPU:

167

168

======= ===========================

169

GPU Number of *ttmp* registers

170

======= ===========================

GFX7 12

GFX8 12

GFX9 16

======= ===========================

175

176

A sequence of *ttmp* registers may be used to operate with more than 32 bits of data.

177

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *ttmp* registers.

178

179

Pairs of *ttmp* registers must be even-aligned (the first register must be even).

180

Sequences of 4 and more *ttmp* registers must be quad-aligned.

181

182

============================================================= ====================================================================

183

Syntax Description

184

============================================================= ====================================================================

185

**ttmp**\ <N> A single 32-bit *ttmp* register.

186

187

*N* must be a decimal integer number.

188

**ttmp[**\ <N>\ **]** A single 32-bit *ttmp* register.

189

190

*N* may be specified as an

191

:ref:`integer number<amdgpu_synid_integer_number>`

192

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

193

**ttmp[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

194

195

*N* and *K* may be specified as

196

:ref:`integer numbers<amdgpu_synid_integer_number>`

197

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

198

**[ttmp**\ <N>, \ **ttmp**\ <N+1>, ... **ttmp**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

199

200

Register indices must be specified as decimal integer numbers.

201

============================================================= ====================================================================

202

203

Note. *N* and *K* must satisfy the following conditions:

204

205

* *N* must be properly aligned based on sequence size.

206

* *N* <= *K*.

207

* 0 <= *N* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

208

* 0 <= *K* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

209

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

210

211

Examples:

212

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

213

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

ttmp0

ttmp[0]

ttmp[0:1]

ttmp[1:1]

ttmp[0:3]

ttmp[2*2]

ttmp[1-1:2-1]

[ttmp4]

[ttmp4,ttmp5,ttmp6,ttmp7]

224

225

Examples of *ttmp* registers with an invalid alignment:

226

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

227

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

ttmp[1:2]

ttmp[2:5]

.. _amdgpu_synid_tba:

tba

---

Trap base address, 64-bits wide. Holds the pointer to the current trap handler program.

238

239

================== ======================================================================= =============

240

Syntax Description Availability

241

================== ======================================================================= =============

242

tba 64-bit *trap base address* register. GFX7, GFX8

243

[tba] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

244

[tba_lo,tba_hi] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

245

================== ======================================================================= =============

246

247

High and low 32 bits of *trap base address* may be accessed as separate registers:

248

249

================== ======================================================================= =============

250

Syntax Description Availability

251

================== ======================================================================= =============

252

tba_lo Low 32 bits of *trap base address* register. GFX7, GFX8

253

tba_hi High 32 bits of *trap base address* register. GFX7, GFX8

254

[tba_lo] Low 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

255

[tba_hi] High 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

256

================== ======================================================================= =============

257

258

Note that *tba*, *tba_lo* and *tba_hi* are not accessible as assembler registers in GFX9,

259

but *tba* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

260

261

.. _amdgpu_synid_tma:

tma

---

Trap memory address, 64-bits wide.

267

268

================= ======================================================================= ==================

269

Syntax Description Availability

270

================= ======================================================================= ==================

271

tma 64-bit *trap memory address* register. GFX7, GFX8

272

[tma] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

273

[tma_lo,tma_hi] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

274

================= ======================================================================= ==================

275

276

High and low 32 bits of *trap memory address* may be accessed as separate registers:

277

278

================= ======================================================================= ==================

279

Syntax Description Availability

280

================= ======================================================================= ==================

281

tma_lo Low 32 bits of *trap memory address* register. GFX7, GFX8

282

tma_hi High 32 bits of *trap memory address* register. GFX7, GFX8

283

[tma_lo] Low 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

284

[tma_hi] High 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

285

================= ======================================================================= ==================

286

287

Note that *tma*, *tma_lo* and *tma_hi* are not accessible as assembler registers in GFX9,

288

but *tma* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

289

290

.. _amdgpu_synid_flat_scratch:

291

292

flat_scratch

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

293

------------

294

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

295

Flat scratch address, 64-bits wide. Holds the base address of scratch memory.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

296

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

297

================================== ================================================================

298

Syntax Description

299

================================== ================================================================

300

flat_scratch 64-bit *flat scratch* address register.

301

[flat_scratch] 64-bit *flat scratch* address register (an alternative syntax).

302

[flat_scratch_lo,flat_scratch_hi] 64-bit *flat scratch* address register (an alternative syntax).

303

================================== ================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

304

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

305

High and low 32 bits of *flat scratch* address may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

306

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

307

========================= =========================================================================

308

Syntax Description

309

========================= =========================================================================

310

flat_scratch_lo Low 32 bits of *flat scratch* address register.

311

flat_scratch_hi High 32 bits of *flat scratch* address register.

312

[flat_scratch_lo] Low 32 bits of *flat scratch* address register (an alternative syntax).

313

[flat_scratch_hi] High 32 bits of *flat scratch* address register (an alternative syntax).

314

========================= =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

315

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

316

.. _amdgpu_synid_xnack:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

317

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

318

xnack

319

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

320

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

321

Xnack mask, 64-bits wide. Holds a 64-bit mask of which threads

322

received an *XNACK* due to a vector memory operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

323

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

324

.. WARNING:: GFX7 does not support *xnack* feature. Not all GFX8 and GFX9 :ref:`processors<amdgpu-processors>` support *xnack* feature.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

325

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

326

\

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

327

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

328

============================== =====================================================

329

Syntax Description

330

============================== =====================================================

331

xnack_mask 64-bit *xnack mask* register.

332

[xnack_mask] 64-bit *xnack mask* register (an alternative syntax).

333

[xnack_mask_lo,xnack_mask_hi] 64-bit *xnack mask* register (an alternative syntax).

334

============================== =====================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

335

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

336

High and low 32 bits of *xnack mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

337

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

338

===================== ==============================================================

339

Syntax Description

340

===================== ==============================================================

341

xnack_mask_lo Low 32 bits of *xnack mask* register.

342

xnack_mask_hi High 32 bits of *xnack mask* register.

343

[xnack_mask_lo] Low 32 bits of *xnack mask* register (an alternative syntax).

344

[xnack_mask_hi] High 32 bits of *xnack mask* register (an alternative syntax).

345

===================== ==============================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

346

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

347

.. _amdgpu_synid_vcc:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

348

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

349

vcc

350

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

351

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

352

Vector condition code, 64-bits wide. A bit mask with one bit per thread;

353

it holds the result of a vector compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

354

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

355

================ =========================================================================

356

Syntax Description

357

================ =========================================================================

358

vcc 64-bit *vector condition code* register.

359

[vcc] 64-bit *vector condition code* register (an alternative syntax).

360

[vcc_lo,vcc_hi] 64-bit *vector condition code* register (an alternative syntax).

361

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

362

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

363

High and low 32 bits of *vector condition code* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

364

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

365

================ =========================================================================

366

Syntax Description

367

================ =========================================================================

368

vcc_lo Low 32 bits of *vector condition code* register.

369

vcc_hi High 32 bits of *vector condition code* register.

370

[vcc_lo] Low 32 bits of *vector condition code* register (an alternative syntax).

371

[vcc_hi] High 32 bits of *vector condition code* register (an alternative syntax).

372

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

373

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

374

.. _amdgpu_synid_m0:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

375

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

376

m0

377

--

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

378

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

379

A 32-bit memory register. It has various uses,

380

including register indexing and bounds checking.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

381

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

382

=========== ===================================================

383

Syntax Description

384

=========== ===================================================

385

m0 A 32-bit *memory* register.

386

[m0] A 32-bit *memory* register (an alternative syntax).

387

=========== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

388

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

389

.. _amdgpu_synid_exec:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

390

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

391

exec

392

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

393

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

394

Execute mask, 64-bits wide. A bit mask with one bit per thread,

395

which is applied to vector instructions and controls which threads execute

396

and which ignore the instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

397

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

398

===================== =================================================================

399

Syntax Description

400

===================== =================================================================

401

exec 64-bit *execute mask* register.

402

[exec] 64-bit *execute mask* register (an alternative syntax).

403

[exec_lo,exec_hi] 64-bit *execute mask* register (an alternative syntax).

404

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

405

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

406

High and low 32 bits of *execute mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

407

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

408

===================== =================================================================

409

Syntax Description

410

===================== =================================================================

411

exec_lo Low 32 bits of *execute mask* register.

412

exec_hi High 32 bits of *execute mask* register.

413

[exec_lo] Low 32 bits of *execute mask* register (an alternative syntax).

414

[exec_hi] High 32 bits of *execute mask* register (an alternative syntax).

415

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

416

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

417

.. _amdgpu_synid_vccz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

418

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

419

vccz

420

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

421

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

422

A single bit-flag indicating that the :ref:`vcc<amdgpu_synid_vcc>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

423

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

424

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

425

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

426

.. _amdgpu_synid_execz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

427

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

428

execz

429

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

430

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

431

A single bit flag indicating that the :ref:`exec<amdgpu_synid_exec>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

432

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

433

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

434

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

435

.. _amdgpu_synid_scc:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

436

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

437

scc

438

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

439

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

440

A single bit flag indicating the result of a scalar compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

441

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

442

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

443

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

444

lds_direct

445

----------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

446

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

447

A special operand which supplies a 32-bit value

448

fetched from *LDS* memory using :ref:`m0<amdgpu_synid_m0>` as an address.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

449

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

450

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

451

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

452

.. _amdgpu_synid_constant:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

453

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

454

constant

455

--------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

456

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

457

A set of integer and floating-point *inline constants*:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

458

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

459

* :ref:`iconst<amdgpu_synid_iconst>`

460

* :ref:`fconst<amdgpu_synid_fconst>`

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

461

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

462

These operands are encoded as a part of instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

463

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

464

If a number may be encoded as either

465

a :ref:`literal<amdgpu_synid_literal>` or

466

an :ref:`inline constant<amdgpu_synid_constant>`,

467

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

468

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

469

.. _amdgpu_synid_iconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

470

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

471

iconst

472

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

473

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

474

An :ref:`integer number<amdgpu_synid_integer_number>`

475

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

476

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

477

Only a small fraction of integer numbers may be encoded as *inline constants*.

478

They are enumerated in the table below.

479

Other integer numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

480

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

481

Integer *inline constants* are converted to

482

:ref:`expected operand type<amdgpu_syn_instruction_type>`

483

as described :ref:`here<amdgpu_synid_int_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

484

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

485

================================== ====================================

486

Value Note

487

================================== ====================================

488

{0..64} Positive integer inline constants.

489

{-16..-1} Negative integer inline constants.

490

================================== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

491

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

492

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

493

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

494

There are also symbolic inline constants which provide read-only access to H/W registers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

495

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

496

.. WARNING:: These inline constants are not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

497

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

498

\

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

499

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

500

======================== ================================================ =============

501

Syntax Note Availability

502

======================== ================================================ =============

503

shared_base Base address of shared memory region. GFX9

504

shared_limit Address of the end of shared memory region. GFX9

505

private_base Base address of private memory region. GFX9

506

private_limit Address of the end of private memory region. GFX9

507

pops_exiting_wave_id A dedicated counter for POPS. GFX9

508

======================== ================================================ =============

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

509

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

510

.. _amdgpu_synid_fconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

511

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

512

fconst

513

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

514

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

515

A :ref:`floating-point number<amdgpu_synid_floating-point_number>`

516

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

517

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

518

Only a small fraction of floating-point numbers may be encoded as *inline constants*.

519

They are enumerated in the table below.

520

Other floating-point numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

521

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

522

Floating-point *inline constants* are converted to

523

:ref:`expected operand type<amdgpu_syn_instruction_type>`

524

as described :ref:`here<amdgpu_synid_fp_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

525

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

526

================================== ===================================================== ==================

527

Value Note Availability

528

================================== ===================================================== ==================

529

0.0 The same as integer constant 0. All GPUs

530

0.5 Floating-point constant 0.5 All GPUs

531

1.0 Floating-point constant 1.0 All GPUs

532

2.0 Floating-point constant 2.0 All GPUs

533

4.0 Floating-point constant 4.0 All GPUs

534

-0.5 Floating-point constant -0.5 All GPUs

535

-1.0 Floating-point constant -1.0 All GPUs

536

-2.0 Floating-point constant -2.0 All GPUs

537

-4.0 Floating-point constant -4.0 All GPUs

538

0.1592 1.0/(2.0*pi). Use only for 16-bit operands. GFX8, GFX9

539

0.15915494 1.0/(2.0*pi). Use only for 16- and 32-bit operands. GFX8, GFX9

540

0.159154943091895317852646485335 1.0/(2.0*pi). GFX8, GFX9

541

================================== ===================================================== ==================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

542

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

543

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

544

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

545

.. _amdgpu_synid_literal:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

546

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

547

literal

548

-------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

549

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

550

A literal is a 64-bit value which is encoded as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

551

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

552

If a number may be encoded as either

553

a :ref:`literal<amdgpu_synid_literal>` or

554

an :ref:`inline constant<amdgpu_synid_constant>`,

555

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

556

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

557

Literals may be specified as :ref:`integer numbers<amdgpu_synid_integer_number>`,

558

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>` or

559

:ref:`expressions<amdgpu_synid_expression>`

560

(expressions are currently supported for 32-bit operands only).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

561

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

562

A 64-bit literal value is converted by assembler

563

to an :ref:`expected operand type<amdgpu_syn_instruction_type>`

564

as described :ref:`here<amdgpu_synid_lit_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

565

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

566

An instruction may use only one literal but several operands may refer the same literal.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

567

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

568

.. _amdgpu_synid_uimm8:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

569

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

570

uimm8

571

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

572

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

573

A 8-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

574

The value is encoded as part of the opcode so it is free to use.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

575

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

576

.. _amdgpu_synid_uimm32:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

577

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

578

uimm32

579

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

580

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

581

A 32-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

582

The value is stored as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

583

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

584

.. _amdgpu_synid_uimm20:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

585

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

586

uimm20

587

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

588

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

589

A 20-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

590

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

591

.. _amdgpu_synid_uimm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

592

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

593

uimm21

594

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

595

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

596

A 21-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

597

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

598

.. WARNING:: Assembler currently supports 20-bit offsets only. Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

599

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

600

.. _amdgpu_synid_simm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

601

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

602

simm21

603

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

604

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

605

A 21-bit :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

606

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

607

.. WARNING:: Assembler currently supports 20-bit unsigned offsets only .Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

608

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

609

.. _amdgpu_synid_off:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

610

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

611

off

612

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

613

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

614

A special entity which indicates that the value of this operand is not used.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

615

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

616

================================== ===================================================

617

Syntax Description

618

================================== ===================================================

619

off Indicates an unused operand.

620

================================== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

621

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

622

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

623

.. _amdgpu_synid_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

624

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

625

Numbers

626

=======

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

627

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

628

.. _amdgpu_synid_integer_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

629

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

630

Integer Numbers

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

631

---------------

632

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

633

Integer numbers are 64 bits wide.

634

They may be specified in binary, octal, hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

635

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

636

============== ====================================

637

Format Syntax

638

============== ====================================

639

Decimal [-]?[1-9][0-9]*

640

Binary [-]?0b[01]+

641

Octal [-]?0[0-7]+

642

Hexadecimal [-]?0x[0-9a-fA-F]+

643

\ [-]?[0x]?[0-9][0-9a-fA-F]*[hH]

644

============== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

645

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

646

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

647

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

648

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

649

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

-1234

0b1010

010

0xff

0ffh

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

655

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

656

.. _amdgpu_synid_floating-point_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

657

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

658

Floating-Point Numbers

659

----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

660

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

661

All floating-point numbers are handled as double (64 bits wide).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

662

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

663

Floating-point numbers may be specified in hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

664

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

665

============== ======================================================== ========================================================

666

Format Syntax Note

667

============== ======================================================== ========================================================

668

Decimal [-]?[0-9]*[.][0-9]*([eE][+-]?[0-9]*)? Must include either a decimal separator or an exponent.

669

Hexadecimal [-]0x[0-9a-fA-F]*(.[0-9a-fA-F]*)?[pP][+-]?[0-9a-fA-F]+

670

============== ======================================================== ========================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

671

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

672

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

673

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

674

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

675

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

-1.234

234e2

-0x1afp-10

0x.1afp10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

680

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

681

.. _amdgpu_synid_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

682

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

683

Expressions

684

===========

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

685

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

686

An expression specifies an address or a numeric value.

687

There are two kinds of expressions:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

688

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

689

* :ref:`Absolute<amdgpu_synid_absolute_expression>`.

690

* :ref:`Relocatable<amdgpu_synid_relocatable_expression>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

691

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

692

.. _amdgpu_synid_absolute_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

693

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

694

Absolute Expressions

695

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

696

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

697

The value of an absolute expression remains the same after program relocation.

698

Absolute expressions must not include unassigned and relocatable values

699

such as labels.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

700

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

701

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

702

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

703

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

704

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

705

x = -1

706

y = x + 10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

707

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

708

.. _amdgpu_synid_relocatable_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

709

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

710

Relocatable Expressions

711

-----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

712

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

713

The value of a relocatable expression depends on program relocation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

714

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

715

Note that use of relocatable expressions is limited with branch targets

716

and 32-bit :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

717

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

718

Addition information about relocation may be found :ref:`here<amdgpu-relocation-records>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

719

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

720

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

721

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

722

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

723

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

724

y = x + 10 // x is not yet defined. Undefined symbols are assumed to be PC-relative.

725

z = .

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

726

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

727

Expression Data Type

728

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

729

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

730

Expressions and operands of expressions are interpreted as 64-bit integers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

731

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

732

Expressions may include 64-bit :ref:`floating-point numbers<amdgpu_synid_floating-point_number>` (double).

733

However these operands are also handled as 64-bit integers

734

using binary representation of specified floating-point numbers.

735

No conversion from floating-point to integer is performed.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

736

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

737

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

738

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

739

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

740

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

741

x = 0.1 // x is assigned an integer 4591870180066957722 which is a binary representation of 0.1.

742

y = x + x // y is a sum of two integer values; it is not equal to 0.2!

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

743

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

744

Syntax

745

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

746

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

747

Expressions are composed of

748

:ref:`symbols<amdgpu_synid_symbol>`,

749

:ref:`integer numbers<amdgpu_synid_integer_number>`,

750

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`,

751

:ref:`binary operators<amdgpu_synid_expression_bin_op>`,

752

:ref:`unary operators<amdgpu_synid_expression_un_op>` and subexpressions.

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

753

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

754

Expressions may also use "." which is a reference to the current PC (program counter).

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

755

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

756

The syntax of expressions is shown below::

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

757

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

758

expr ::= expr binop expr | primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

759

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

760

primaryexpr ::= '(' expr ')' | symbol | number | '.' | unop primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

761

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

binop ::= '&&'

| '||'

| '|'

| '^'

| '&'

| '!'

| '=='

| '!='

| '<>'

| '<'

| '<='

| '>'

| '>='

| '<<'

| '>>'

| '+'

| '-'

| '*'

| '/'

| '%' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

782

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

unop ::= '~'

| '+'

| '-'

| '!' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

787

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

788

.. _amdgpu_synid_expression_bin_op:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

789

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

790

Binary Operators

791

----------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

792

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

793

Binary operators are described in the following table.

794

They operate on and produce 64-bit integers.

795

Operators with higher priority are performed first.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

796

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

797

========== ========= ===============================================

798

Operator Priority Meaning

799

========== ========= ===============================================

800

\* 5 Integer multiplication.

801

/ 5 Integer division.

802

% 5 Integer signed remainder.

803

\+ 4 Integer addition.

804

\- 4 Integer subtraction.

805

<< 3 Integer shift left.

806

>> 3 Logical shift right.

807

== 2 Equality comparison.

808

!= 2 Inequality comparison.

809

<> 2 Inequality comparison.

810

< 2 Signed less than comparison.

811

<= 2 Signed less than or equal comparison.

812

> 2 Signed greater than comparison.

813

>= 2 Signed greater than or equal comparison.

\| 1 Bitwise or.

^ 1 Bitwise xor.

& 1 Bitwise and.

&& 0 Logical and.

|| 0 Logical or.

========== ========= ===============================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

820

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

821

.. _amdgpu_synid_expression_un_op:

Unary Operators

---------------

Unary operators are described in the following table.

827

They operate on and produce 64-bit integers.

828

829

========== ===============================================

830

Operator Meaning

831

========== ===============================================

832

! Logical negation.

833

~ Bitwise negation.

834

\+ Integer unary plus.

835

\- Integer unary minus.

836

========== ===============================================

837

838

.. _amdgpu_synid_symbol:

Symbols

-------

A symbol is a named 64-bit value, representing a relocatable

844

address or an absolute (non-relocatable) number.

845

846

Symbol names have the following syntax:

847

``[a-zA-Z_.][a-zA-Z0-9_$.@]*``

848

849

The table below provides several examples of syntax used for symbol definition.

850

851

================ ==========================================================

852

Syntax Meaning

853

================ ==========================================================

854

.globl <S> Declares a global symbol S without assigning it a value.

855

.set <S>, <E> Assigns the value of an expression E to a symbol S.

856

<S> = <E> Assigns the value of an expression E to a symbol S.

857

<S>: Declares a label S and assigns it the current PC value.

858

================ ==========================================================

859

860

A symbol may be used before it is declared or assigned;

861

unassigned symbols are assumed to be PC-relative.

862

863

Addition information about symbols may be found :ref:`here<amdgpu-symbols>`.

864

865

.. _amdgpu_synid_conv:

Conversions

===========

This section describes what happens when a 64-bit

871

:ref:`integer number<amdgpu_synid_integer_number>`, a

872

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>` or a

873

:ref:`symbol<amdgpu_synid_symbol>`

874

is used for an operand which has a different type or size.

875

876

Depending on operand kind, this conversion is performed by either assembler or AMDGPU H/W:

877

878

* Values encoded as :ref:`inline constants<amdgpu_synid_constant>` are handled by H/W.

879

* Values encoded as :ref:`literals<amdgpu_synid_literal>` are converted by assembler.

880

881

.. _amdgpu_synid_const_conv:

Inline Constants

----------------

.. _amdgpu_synid_int_const_conv:

887

888

Integer Inline Constants

889

~~~~~~~~~~~~~~~~~~~~~~~~

890

891

Integer :ref:`inline constants<amdgpu_synid_constant>`

892

may be thought of as 64-bit

893

:ref:`integer numbers<amdgpu_synid_integer_number>`;

894

when used as operands they are truncated to the size of

895

:ref:`expected operand type<amdgpu_syn_instruction_type>`.

896

No data type conversions are performed.

897

898

Examples:

899

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

900

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_u16 v0, -1, 0 // v0 = 0xFFFF

905

v_add_f16 v0, -1, 0 // v0 = 0xFFFF (NaN)

906

907

v_add_u32 v0, -1, 0 // v0 = 0xFFFFFFFF

908

v_add_f32 v0, -1, 0 // v0 = 0xFFFFFFFF (NaN)

909

910

.. _amdgpu_synid_fp_const_conv:

911

912

Floating-Point Inline Constants

913

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

914

915

Floating-point :ref:`inline constants<amdgpu_synid_constant>`

916

may be thought of as 64-bit

917

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`;

918

when used as operands they are converted to a floating-point number of

919

:ref:`expected operand size<amdgpu_syn_instruction_type>`.

920

921

Examples:

922

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

923

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_f16 v0, 1.0, 0 // v0 = 0x3C00 (1.0)

928

v_add_u16 v0, 1.0, 0 // v0 = 0x3C00

929

930

v_add_f32 v0, 1.0, 0 // v0 = 0x3F800000 (1.0)

931

v_add_u32 v0, 1.0, 0 // v0 = 0x3F800000

932

933

934

.. _amdgpu_synid_lit_conv:

Literals

--------

.. _amdgpu_synid_int_lit_conv:

Integer Literals

~~~~~~~~~~~~~~~~

Integer :ref:`literals<amdgpu_synid_literal>`

945

are specified as 64-bit :ref:`integer numbers<amdgpu_synid_integer_number>`.

946

947

When used as operands they are converted to

948

:ref:`expected operand type<amdgpu_syn_instruction_type>` as described below.

949

950

============== ============== =============== ====================================================================

951

Expected type Condition Result Note

952

============== ============== =============== ====================================================================

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

953

i16, u16, b16 cond(num,16) num.u16 Truncate to 16 bits.

954

i32, u32, b32 cond(num,32) num.u32 Truncate to 32 bits.

955

i64 cond(num,32) {-1,num.i32} Truncate to 32 bits and then sign-extend the result to 64 bits.

956

u64, b64 cond(num,32) { 0,num.u32} Truncate to 32 bits and then zero-extend the result to 64 bits.

957

f16 cond(num,16) num.u16 Use low 16 bits as an f16 value.

958

f32 cond(num,32) num.u32 Use low 32 bits as an f32 value.

959

f64 cond(num,32) {num.u32,0} Use low 32 bits of the number as high 32 bits

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

960

of the result; low 32 bits of the result are zeroed.

961

============== ============== =============== ====================================================================

962

963

The condition *cond(X,S)* indicates if a 64-bit number *X*

964

can be converted to a smaller size *S* by truncation of upper bits.

965

There are two cases when the conversion is possible:

966

967

* The truncated bits are all 0.

968

* The truncated bits are all 1 and the value after truncation has its MSB bit set.

969

970

Examples of valid literals:

971

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

972

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

973

974

// GFX9

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

975

// Literal value after conversion:

976

v_add_u16 v0, 0xff00, v0 // 0xff00

977

v_add_u16 v0, 0xffffffffffffff00, v0 // 0xff00

978

v_add_u16 v0, -256, v0 // 0xff00

979

// Literal value after conversion:

980

s_bfe_i64 s[0:1], 0xffefffff, s3 // 0xffffffffffefffff

981

s_bfe_u64 s[0:1], 0xffefffff, s3 // 0x00000000ffefffff

982

v_ceil_f64_e32 v[0:1], 0xffefffff // 0xffefffff00000000 (-1.7976922776554302e308)

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

983

984

Examples of invalid literals:

985

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

986

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

987

988

// GFX9

989

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

990

v_add_u16 v0, 0x1ff00, v0 // truncated bits are not all 0 or 1

991

v_add_u16 v0, 0xffffffffffff00ff, v0 // truncated bits do not match MSB of the result

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

992

993

.. _amdgpu_synid_fp_lit_conv:

994

995

Floating-Point Literals

996

~~~~~~~~~~~~~~~~~~~~~~~

997

998

Floating-point :ref:`literals<amdgpu_synid_literal>` are specified as 64-bit

999

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`.

1000

1001

When used as operands they are converted to

1002

:ref:`expected operand type<amdgpu_syn_instruction_type>` as described below.

1003

1004

============== ============== ================= =================================================================

1005

Expected type Condition Result Note

1006

============== ============== ================= =================================================================

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1007

i16, u16, b16 cond(num,16) f16(num) Convert to f16 and use bits of the result as an integer value.

1008

i32, u32, b32 cond(num,32) f32(num) Convert to f32 and use bits of the result as an integer value.

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1009

i64, u64, b64 false \- Conversion disabled because of an unclear semantics.

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1010

f16 cond(num,16) f16(num) Convert to f16.

1011

f32 cond(num,32) f32(num) Convert to f32.

1012

f64 true {num.u32.hi,0} Use high 32 bits of the number as high 32 bits of the result;

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1013

zero-fill low 32 bits of the result.

1014

1015

Note that the result may differ from the original number.

1016

============== ============== ================= =================================================================

1017

1018

The condition *cond(X,S)* indicates if an f64 number *X* can be converted

1019

to a smaller *S*-bit floating-point type without overflow or underflow.

1020

Precision lost is allowed.

1021

1022

Examples of valid literals:

1023

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1024

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_f16 v1, 65500.0, v2

1029

v_add_f32 v1, 65600.0, v2

1030

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1031

// Literal value before conversion: 1.7976931348623157e308 (0x7fefffffffffffff)

1032

// Literal value after conversion: 1.7976922776554302e308 (0x7fefffff00000000)

1033

v_ceil_f64 v[0:1], 1.7976931348623157e308

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1034

1035

Examples of invalid literals:

1036

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1037

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1038

1039

// GFX9

1040

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1041

v_add_f16 v1, 65600.0, v2 // overflow

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1042

1043

.. _amdgpu_synid_exp_conv:

Expressions

~~~~~~~~~~~

Expressions operate with and result in 64-bit integers.

1049

1050

When used as operands they are truncated to

1051

:ref:`expected operand size<amdgpu_syn_instruction_type>`.

1052

No data type conversions are performed.

1053

1054

Examples:

1055

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1056

.. parsed-literal::

Dmitry Preobrazhensky