Blame - src/compiler/codegen/x86/FP/X86FP.cc - platform_art

blob: 8cd32b45fd21f4a4e044e9d7a11b761406c33d58 [file] [log] [blame]

buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	1	/*
				2	* Copyright (C) 2012 The Android Open Source Project
				3	*
				4	* Licensed under the Apache License, Version 2.0 (the "License");
				5	* you may not use this file except in compliance with the License.
				6	* You may obtain a copy of the License at
				7	*
				8	* http://www.apache.org/licenses/LICENSE-2.0
				9	*
				10	* Unless required by applicable law or agreed to in writing, software
				11	* distributed under the License is distributed on an "AS IS" BASIS,
				12	* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
				13	* See the License for the specific language governing permissions and
				14	* limitations under the License.
				15	*/
				16
				17	namespace art {
				18
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	19	static bool genArithOpFloat(CompilationUnit *cUnit, Instruction::Code opcode,
Bill Buzbee	a114add	2012-05-03 15:00:40 -0700	[diff] [blame]	20	RegLocation rlDest, RegLocation rlSrc1,
				21	RegLocation rlSrc2) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	22	X86OpCode op = kX86Nop;
				23	RegLocation rlResult;
jeffhao	fdffdf8	2012-07-11 16:08:43 -0700	[diff] [blame]	24	int tempReg;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	25
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	26	/*
				27	* Don't attempt to optimize register usage since these opcodes call out to
				28	* the handlers.
				29	*/
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	30	switch (opcode) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	31	case Instruction::ADD_FLOAT_2ADDR:
				32	case Instruction::ADD_FLOAT:
				33	op = kX86AddssRR;
				34	break;
				35	case Instruction::SUB_FLOAT_2ADDR:
				36	case Instruction::SUB_FLOAT:
				37	op = kX86SubssRR;
				38	break;
				39	case Instruction::DIV_FLOAT_2ADDR:
				40	case Instruction::DIV_FLOAT:
				41	op = kX86DivssRR;
				42	break;
				43	case Instruction::MUL_FLOAT_2ADDR:
				44	case Instruction::MUL_FLOAT:
				45	op = kX86MulssRR;
				46	break;
				47	case Instruction::NEG_FLOAT:
jeffhao	fdffdf8	2012-07-11 16:08:43 -0700	[diff] [blame]	48	// TODO: Make this an XorpsRM where the memory location holds 0x80000000
				49	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				50	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				51	tempReg = oatAllocTemp(cUnit);
				52	loadConstant(cUnit, tempReg, 0x80000000);
				53	newLIR2(cUnit, kX86MovdxrRR, rlResult.lowReg, tempReg);
				54	newLIR2(cUnit, kX86XorpsRR, rlResult.lowReg, rlSrc1.lowReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	55	storeValue(cUnit, rlDest, rlResult);
				56	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	57	case Instruction::REM_FLOAT_2ADDR:
				58	case Instruction::REM_FLOAT: {
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	59	return genArithOpFloatPortable(cUnit, opcode, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	60	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	61	default:
				62	return true;
				63	}
				64	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				65	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				66	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				67	int rDest = rlResult.lowReg;
				68	int rSrc1 = rlSrc1.lowReg;
				69	int rSrc2 = rlSrc2.lowReg;
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	70	if (rSrc2 == rDest) {
				71	rSrc2 = oatAllocTempFloat(cUnit);
				72	opRegCopy(cUnit, rSrc2, rDest);
				73	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	74	opRegCopy(cUnit, rDest, rSrc1);
				75	newLIR2(cUnit, op, rDest, rSrc2);
				76	storeValue(cUnit, rlDest, rlResult);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	77
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	78	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	79	}
				80
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	81	static bool genArithOpDouble(CompilationUnit *cUnit, Instruction::Code opcode,
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	82	RegLocation rlDest, RegLocation rlSrc1,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	83	RegLocation rlSrc2) {
				84	X86OpCode op = kX86Nop;
				85	RegLocation rlResult;
jeffhao	fdffdf8	2012-07-11 16:08:43 -0700	[diff] [blame]	86	int tempReg;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	87
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	88	switch (opcode) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	89	case Instruction::ADD_DOUBLE_2ADDR:
				90	case Instruction::ADD_DOUBLE:
				91	op = kX86AddsdRR;
				92	break;
				93	case Instruction::SUB_DOUBLE_2ADDR:
				94	case Instruction::SUB_DOUBLE:
				95	op = kX86SubsdRR;
				96	break;
				97	case Instruction::DIV_DOUBLE_2ADDR:
				98	case Instruction::DIV_DOUBLE:
				99	op = kX86DivsdRR;
				100	break;
				101	case Instruction::MUL_DOUBLE_2ADDR:
				102	case Instruction::MUL_DOUBLE:
				103	op = kX86MulsdRR;
				104	break;
				105	case Instruction::NEG_DOUBLE:
jeffhao	fdffdf8	2012-07-11 16:08:43 -0700	[diff] [blame]	106	// TODO: Make this an XorpdRM where the memory location holds 0x8000000000000000
				107	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				108	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				109	tempReg = oatAllocTemp(cUnit);
				110	loadConstant(cUnit, tempReg, 0x80000000);
				111	newLIR2(cUnit, kX86MovdxrRR, rlResult.lowReg, tempReg);
				112	newLIR2(cUnit, kX86PsllqRI, rlResult.lowReg, 32);
				113	newLIR2(cUnit, kX86XorpsRR, rlResult.lowReg, rlSrc1.lowReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	114	storeValueWide(cUnit, rlDest, rlResult);
				115	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	116	case Instruction::REM_DOUBLE_2ADDR:
				117	case Instruction::REM_DOUBLE: {
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	118	return genArithOpDoublePortable(cUnit, opcode, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	119	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	120	default:
				121	return true;
				122	}
				123	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				124	DCHECK(rlSrc1.wide);
				125	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				126	DCHECK(rlSrc2.wide);
				127	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				128	DCHECK(rlDest.wide);
				129	DCHECK(rlResult.wide);
				130	int rDest = S2D(rlResult.lowReg, rlResult.highReg);
				131	int rSrc1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
				132	int rSrc2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	133	if (rDest == rSrc2) {
				134	rSrc2 = oatAllocTempDouble(cUnit) \| FP_DOUBLE;
				135	opRegCopy(cUnit, rSrc2, rDest);
				136	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	137	opRegCopy(cUnit, rDest, rSrc1);
				138	newLIR2(cUnit, op, rDest, rSrc2);
				139	storeValueWide(cUnit, rlDest, rlResult);
				140	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	141	}
				142
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	143	static bool genConversion(CompilationUnit *cUnit, Instruction::Code opcode,
				144	RegLocation rlDest, RegLocation rlSrc) {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	145	RegisterClass rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	146	X86OpCode op = kX86Nop;
				147	int srcReg;
				148	RegLocation rlResult;
				149	switch (opcode) {
				150	case Instruction::INT_TO_FLOAT:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	151	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	152	op = kX86Cvtsi2ssRR;
				153	break;
				154	case Instruction::DOUBLE_TO_FLOAT:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	155	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	156	op = kX86Cvtsd2ssRR;
				157	break;
				158	case Instruction::FLOAT_TO_DOUBLE:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	159	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	160	op = kX86Cvtss2sdRR;
				161	break;
				162	case Instruction::INT_TO_DOUBLE:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	163	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	164	op = kX86Cvtsi2sdRR;
				165	break;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	166	case Instruction::FLOAT_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	167	rlSrc = loadValue(cUnit, rlSrc, kFPReg);
				168	srcReg = rlSrc.lowReg;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	169	oatClobberSReg(cUnit, rlDest.sRegLow);
				170	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	171	int tempReg = oatAllocTempFloat(cUnit);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	172
				173	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				174	newLIR2(cUnit, kX86Cvtsi2ssRR, tempReg, rlResult.lowReg);
				175	newLIR2(cUnit, kX86ComissRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	176	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				177	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				178	newLIR2(cUnit, kX86Cvttss2siRR, rlResult.lowReg, srcReg);
				179	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				180	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				181	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				182	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				183	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	184	storeValue(cUnit, rlDest, rlResult);
				185	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	186	}
				187	case Instruction::DOUBLE_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	188	rlSrc = loadValueWide(cUnit, rlSrc, kFPReg);
				189	srcReg = rlSrc.lowReg;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	190	oatClobberSReg(cUnit, rlDest.sRegLow);
				191	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	192	int tempReg = oatAllocTempDouble(cUnit) \| FP_DOUBLE;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	193
				194	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				195	newLIR2(cUnit, kX86Cvtsi2sdRR, tempReg, rlResult.lowReg);
				196	newLIR2(cUnit, kX86ComisdRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	197	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				198	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				199	newLIR2(cUnit, kX86Cvttsd2siRR, rlResult.lowReg, srcReg);
				200	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				201	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				202	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				203	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				204	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	205	storeValue(cUnit, rlDest, rlResult);
				206	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	207	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	208	case Instruction::LONG_TO_DOUBLE:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	209	case Instruction::LONG_TO_FLOAT:
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	210	// These can be implemented inline by using memory as a 64-bit source.
				211	// However, this can't be done easily if the register has been promoted.
				212	UNIMPLEMENTED(WARNING) << "inline l2[df] " << PrettyMethod(cUnit->method_idx, *cUnit->dex_file);
				213	case Instruction::FLOAT_TO_LONG:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	214	case Instruction::DOUBLE_TO_LONG:
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	215	return genConversionPortable(cUnit, opcode, rlDest, rlSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	216	default:
				217	return true;
				218	}
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	219	if (rlSrc.wide) {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	220	rlSrc = loadValueWide(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	221	srcReg = S2D(rlSrc.lowReg, rlSrc.highReg);
				222	} else {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	223	rlSrc = loadValue(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	224	srcReg = rlSrc.lowReg;
				225	}
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	226	if (rlDest.wide) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	227	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				228	newLIR2(cUnit, op, S2D(rlResult.lowReg, rlResult.highReg), srcReg);
				229	storeValueWide(cUnit, rlDest, rlResult);
				230	} else {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	231	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				232	newLIR2(cUnit, op, rlResult.lowReg, srcReg);
				233	storeValue(cUnit, rlDest, rlResult);
				234	}
				235	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	236	}
				237
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	238	static bool genCmpFP(CompilationUnit *cUnit, Instruction::Code code, RegLocation rlDest,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	239	RegLocation rlSrc1, RegLocation rlSrc2) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	240	bool single = (code == Instruction::CMPL_FLOAT) \|\| (code == Instruction::CMPG_FLOAT);
				241	bool unorderedGt = (code == Instruction::CMPG_DOUBLE) \|\| (code == Instruction::CMPG_FLOAT);
				242	int srcReg1;
				243	int srcReg2;
				244	if (single) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	245	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				246	srcReg1 = rlSrc1.lowReg;
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	247	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				248	srcReg2 = rlSrc2.lowReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	249	} else {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	250	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				251	srcReg1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	252	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				253	srcReg2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
				254	}
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	255	oatClobberSReg(cUnit, rlDest.sRegLow);
Ian Rogers	c6f3bb8	2012-03-21 20:40:33 -0700	[diff] [blame]	256	RegLocation rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
				257	loadConstantNoClobber(cUnit, rlResult.lowReg, unorderedGt ? 1 : 0);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	258	if (single) {
				259	newLIR2(cUnit, kX86UcomissRR, srcReg1, srcReg2);
				260	} else {
				261	newLIR2(cUnit, kX86UcomisdRR, srcReg1, srcReg2);
				262	}
				263	LIR* branch = NULL;
				264	if (unorderedGt) {
Ian Rogers	b41b33b	2012-03-20 14:22:54 -0700	[diff] [blame]	265	branch = newLIR2(cUnit, kX86Jcc8, 0, kX86CondPE);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	266	}
jeffhao	703f2cd	2012-07-13 17:25:52 -0700	[diff] [blame^]	267	// If the result reg can't be byte accessed, use a jump and move instead of a set.
				268	if (rlResult.lowReg >= 4) {
				269	LIR* branch2 = NULL;
				270	if (unorderedGt) {
				271	branch2 = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				272	newLIR2(cUnit, kX86Mov32RI, rlResult.lowReg, 0x0);
				273	} else {
				274	branch2 = newLIR2(cUnit, kX86Jcc8, 0, kX86CondBe);
				275	newLIR2(cUnit, kX86Mov32RI, rlResult.lowReg, 0x1);
				276	}
				277	branch2->target = newLIR0(cUnit, kPseudoTargetLabel);
				278	} else {
				279	newLIR2(cUnit, kX86Set8R, rlResult.lowReg, kX86CondA /* above - unsigned > */);
				280	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	281	newLIR2(cUnit, kX86Sbb32RI, rlResult.lowReg, 0);
				282	if (unorderedGt) {
				283	branch->target = newLIR0(cUnit, kPseudoTargetLabel);
				284	}
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	285	storeValue(cUnit, rlDest, rlResult);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	286	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	287	}
				288
				289	} // namespace art