Blame - src/compiler/codegen/x86/FP/X86FP.cc - platform_art

blob: e6b47d2a3754599e19e0dd09eb3feba4b8d9b1c8 [file] [log] [blame]

buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	1	/*
				2	* Copyright (C) 2012 The Android Open Source Project
				3	*
				4	* Licensed under the Apache License, Version 2.0 (the "License");
				5	* you may not use this file except in compliance with the License.
				6	* You may obtain a copy of the License at
				7	*
				8	* http://www.apache.org/licenses/LICENSE-2.0
				9	*
				10	* Unless required by applicable law or agreed to in writing, software
				11	* distributed under the License is distributed on an "AS IS" BASIS,
				12	* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
				13	* See the License for the specific language governing permissions and
				14	* limitations under the License.
				15	*/
				16
				17	namespace art {
				18
Bill Buzbee	a114add	2012-05-03 15:00:40 -0700	[diff] [blame]	19	static bool genArithOpFloat(CompilationUnit cUnit, MIR mir,
				20	RegLocation rlDest, RegLocation rlSrc1,
				21	RegLocation rlSrc2) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	22	X86OpCode op = kX86Nop;
				23	RegLocation rlResult;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	24
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	25	/*
				26	* Don't attempt to optimize register usage since these opcodes call out to
				27	* the handlers.
				28	*/
				29	switch (mir->dalvikInsn.opcode) {
				30	case Instruction::ADD_FLOAT_2ADDR:
				31	case Instruction::ADD_FLOAT:
				32	op = kX86AddssRR;
				33	break;
				34	case Instruction::SUB_FLOAT_2ADDR:
				35	case Instruction::SUB_FLOAT:
				36	op = kX86SubssRR;
				37	break;
				38	case Instruction::DIV_FLOAT_2ADDR:
				39	case Instruction::DIV_FLOAT:
				40	op = kX86DivssRR;
				41	break;
				42	case Instruction::MUL_FLOAT_2ADDR:
				43	case Instruction::MUL_FLOAT:
				44	op = kX86MulssRR;
				45	break;
				46	case Instruction::NEG_FLOAT:
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	47	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				48	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				49	newLIR2(cUnit, kX86XorpsRR, rlResult.lowReg, rlResult.lowReg);
				50	newLIR2(cUnit, kX86SubssRR, rlResult.lowReg, rlSrc1.lowReg);
				51	storeValue(cUnit, rlDest, rlResult);
				52	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	53	case Instruction::REM_FLOAT_2ADDR:
				54	case Instruction::REM_FLOAT: {
				55	return genArithOpFloatPortable(cUnit, mir, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	56	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	57	default:
				58	return true;
				59	}
				60	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				61	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				62	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				63	int rDest = rlResult.lowReg;
				64	int rSrc1 = rlSrc1.lowReg;
				65	int rSrc2 = rlSrc2.lowReg;
				66	// TODO: at least CHECK_NE(rDest, rSrc2);
				67	opRegCopy(cUnit, rDest, rSrc1);
				68	newLIR2(cUnit, op, rDest, rSrc2);
				69	storeValue(cUnit, rlDest, rlResult);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	70
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	71	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	72	}
				73
				74	static bool genArithOpDouble(CompilationUnit cUnit, MIR mir,
				75	RegLocation rlDest, RegLocation rlSrc1,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	76	RegLocation rlSrc2) {
				77	X86OpCode op = kX86Nop;
				78	RegLocation rlResult;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	79
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	80	switch (mir->dalvikInsn.opcode) {
				81	case Instruction::ADD_DOUBLE_2ADDR:
				82	case Instruction::ADD_DOUBLE:
				83	op = kX86AddsdRR;
				84	break;
				85	case Instruction::SUB_DOUBLE_2ADDR:
				86	case Instruction::SUB_DOUBLE:
				87	op = kX86SubsdRR;
				88	break;
				89	case Instruction::DIV_DOUBLE_2ADDR:
				90	case Instruction::DIV_DOUBLE:
				91	op = kX86DivsdRR;
				92	break;
				93	case Instruction::MUL_DOUBLE_2ADDR:
				94	case Instruction::MUL_DOUBLE:
				95	op = kX86MulsdRR;
				96	break;
				97	case Instruction::NEG_DOUBLE:
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	98	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				99	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				100	newLIR2(cUnit, kX86XorpsRR, rlResult.lowReg, rlResult.lowReg);
				101	newLIR2(cUnit, kX86SubsdRR, rlResult.lowReg, rlSrc1.lowReg);
				102	storeValueWide(cUnit, rlDest, rlResult);
				103	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	104	case Instruction::REM_DOUBLE_2ADDR:
				105	case Instruction::REM_DOUBLE: {
				106	return genArithOpDoublePortable(cUnit, mir, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	107	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	108	default:
				109	return true;
				110	}
				111	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				112	DCHECK(rlSrc1.wide);
				113	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				114	DCHECK(rlSrc2.wide);
				115	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				116	DCHECK(rlDest.wide);
				117	DCHECK(rlResult.wide);
				118	int rDest = S2D(rlResult.lowReg, rlResult.highReg);
				119	int rSrc1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
				120	int rSrc2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
				121	// TODO: at least CHECK_NE(rDest, rSrc2);
				122	opRegCopy(cUnit, rDest, rSrc1);
				123	newLIR2(cUnit, op, rDest, rSrc2);
				124	storeValueWide(cUnit, rlDest, rlResult);
				125	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	126	}
				127
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	128	static bool genConversion(CompilationUnit cUnit, MIR mir) {
				129	Instruction::Code opcode = mir->dalvikInsn.opcode;
				130	bool longSrc = false;
				131	bool longDest = false;
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	132	RegisterClass rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	133	RegLocation rlSrc;
				134	RegLocation rlDest;
				135	X86OpCode op = kX86Nop;
				136	int srcReg;
				137	RegLocation rlResult;
				138	switch (opcode) {
				139	case Instruction::INT_TO_FLOAT:
				140	longSrc = false;
				141	longDest = false;
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	142	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	143	op = kX86Cvtsi2ssRR;
				144	break;
				145	case Instruction::DOUBLE_TO_FLOAT:
				146	longSrc = true;
				147	longDest = false;
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	148	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	149	op = kX86Cvtsd2ssRR;
				150	break;
				151	case Instruction::FLOAT_TO_DOUBLE:
				152	longSrc = false;
				153	longDest = true;
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	154	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	155	op = kX86Cvtss2sdRR;
				156	break;
				157	case Instruction::INT_TO_DOUBLE:
				158	longSrc = false;
				159	longDest = true;
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	160	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	161	op = kX86Cvtsi2sdRR;
				162	break;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	163	case Instruction::FLOAT_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	164	rlSrc = oatGetSrc(cUnit, mir, 0);
				165	rlSrc = loadValue(cUnit, rlSrc, kFPReg);
				166	srcReg = rlSrc.lowReg;
				167	rlDest = oatGetDest(cUnit, mir, 0);
				168	oatClobberSReg(cUnit, rlDest.sRegLow);
				169	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	170	int tempReg = oatAllocTempFloat(cUnit);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	171
				172	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				173	newLIR2(cUnit, kX86Cvtsi2ssRR, tempReg, rlResult.lowReg);
				174	newLIR2(cUnit, kX86ComissRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	175	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				176	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				177	newLIR2(cUnit, kX86Cvttss2siRR, rlResult.lowReg, srcReg);
				178	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				179	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				180	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				181	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				182	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	183	storeValue(cUnit, rlDest, rlResult);
				184	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	185	}
				186	case Instruction::DOUBLE_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	187	rlSrc = oatGetSrcWide(cUnit, mir, 0, 1);
				188	rlSrc = loadValueWide(cUnit, rlSrc, kFPReg);
				189	srcReg = rlSrc.lowReg;
				190	rlDest = oatGetDest(cUnit, mir, 0);
				191	oatClobberSReg(cUnit, rlDest.sRegLow);
				192	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	193	int tempReg = oatAllocTempDouble(cUnit);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	194
				195	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				196	newLIR2(cUnit, kX86Cvtsi2sdRR, tempReg, rlResult.lowReg);
				197	newLIR2(cUnit, kX86ComisdRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	198	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				199	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				200	newLIR2(cUnit, kX86Cvttsd2siRR, rlResult.lowReg, srcReg);
				201	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				202	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				203	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				204	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				205	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	206	storeValue(cUnit, rlDest, rlResult);
				207	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	208	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	209	case Instruction::LONG_TO_DOUBLE:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	210	case Instruction::LONG_TO_FLOAT:
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	211	// These can be implemented inline by using memory as a 64-bit source.
				212	// However, this can't be done easily if the register has been promoted.
				213	UNIMPLEMENTED(WARNING) << "inline l2[df] " << PrettyMethod(cUnit->method_idx, *cUnit->dex_file);
				214	case Instruction::FLOAT_TO_LONG:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	215	case Instruction::DOUBLE_TO_LONG:
				216	return genConversionPortable(cUnit, mir);
				217	default:
				218	return true;
				219	}
				220	if (longSrc) {
				221	rlSrc = oatGetSrcWide(cUnit, mir, 0, 1);
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	222	rlSrc = loadValueWide(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	223	srcReg = S2D(rlSrc.lowReg, rlSrc.highReg);
				224	} else {
				225	rlSrc = oatGetSrc(cUnit, mir, 0);
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	226	rlSrc = loadValue(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	227	srcReg = rlSrc.lowReg;
				228	}
				229	if (longDest) {
				230	rlDest = oatGetDestWide(cUnit, mir, 0, 1);
				231	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				232	newLIR2(cUnit, op, S2D(rlResult.lowReg, rlResult.highReg), srcReg);
				233	storeValueWide(cUnit, rlDest, rlResult);
				234	} else {
				235	rlDest = oatGetDest(cUnit, mir, 0);
				236	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				237	newLIR2(cUnit, op, rlResult.lowReg, srcReg);
				238	storeValue(cUnit, rlDest, rlResult);
				239	}
				240	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	241	}
				242
				243	static bool genCmpFP(CompilationUnit cUnit, MIR mir, RegLocation rlDest,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	244	RegLocation rlSrc1, RegLocation rlSrc2) {
				245	Instruction::Code code = mir->dalvikInsn.opcode;
				246	bool single = (code == Instruction::CMPL_FLOAT) \|\| (code == Instruction::CMPG_FLOAT);
				247	bool unorderedGt = (code == Instruction::CMPG_DOUBLE) \|\| (code == Instruction::CMPG_FLOAT);
				248	int srcReg1;
				249	int srcReg2;
				250	if (single) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	251	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				252	srcReg1 = rlSrc1.lowReg;
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	253	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				254	srcReg2 = rlSrc2.lowReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	255	} else {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	256	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				257	srcReg1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	258	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				259	srcReg2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
				260	}
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	261	oatClobberSReg(cUnit, rlDest.sRegLow);
Ian Rogers	c6f3bb8	2012-03-21 20:40:33 -0700	[diff] [blame]	262	RegLocation rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
				263	loadConstantNoClobber(cUnit, rlResult.lowReg, unorderedGt ? 1 : 0);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	264	if (single) {
				265	newLIR2(cUnit, kX86UcomissRR, srcReg1, srcReg2);
				266	} else {
				267	newLIR2(cUnit, kX86UcomisdRR, srcReg1, srcReg2);
				268	}
				269	LIR* branch = NULL;
				270	if (unorderedGt) {
Ian Rogers	b41b33b	2012-03-20 14:22:54 -0700	[diff] [blame]	271	branch = newLIR2(cUnit, kX86Jcc8, 0, kX86CondPE);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	272	}
				273	newLIR2(cUnit, kX86Set8R, rlResult.lowReg, kX86CondA /* above - unsigned > */);
				274	newLIR2(cUnit, kX86Sbb32RI, rlResult.lowReg, 0);
				275	if (unorderedGt) {
				276	branch->target = newLIR0(cUnit, kPseudoTargetLabel);
				277	}
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	278	storeValue(cUnit, rlDest, rlResult);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	279	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	280	}
				281
				282	} // namespace art