Blame - src/compiler/codegen/x86/FP/X86FP.cc - platform_art

blob: c00b5fc7ff6e1b5789a2592314b5ce2c168704b0 [file] [log] [blame]

buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	1	/*
				2	* Copyright (C) 2012 The Android Open Source Project
				3	*
				4	* Licensed under the Apache License, Version 2.0 (the "License");
				5	* you may not use this file except in compliance with the License.
				6	* You may obtain a copy of the License at
				7	*
				8	* http://www.apache.org/licenses/LICENSE-2.0
				9	*
				10	* Unless required by applicable law or agreed to in writing, software
				11	* distributed under the License is distributed on an "AS IS" BASIS,
				12	* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
				13	* See the License for the specific language governing permissions and
				14	* limitations under the License.
				15	*/
				16
				17	namespace art {
				18
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	19	static bool genArithOpFloat(CompilationUnit *cUnit, Instruction::Code opcode,
Bill Buzbee	a114add	2012-05-03 15:00:40 -0700	[diff] [blame]	20	RegLocation rlDest, RegLocation rlSrc1,
				21	RegLocation rlSrc2) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	22	X86OpCode op = kX86Nop;
				23	RegLocation rlResult;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	24
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	25	/*
				26	* Don't attempt to optimize register usage since these opcodes call out to
				27	* the handlers.
				28	*/
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	29	switch (opcode) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	30	case Instruction::ADD_FLOAT_2ADDR:
				31	case Instruction::ADD_FLOAT:
				32	op = kX86AddssRR;
				33	break;
				34	case Instruction::SUB_FLOAT_2ADDR:
				35	case Instruction::SUB_FLOAT:
				36	op = kX86SubssRR;
				37	break;
				38	case Instruction::DIV_FLOAT_2ADDR:
				39	case Instruction::DIV_FLOAT:
				40	op = kX86DivssRR;
				41	break;
				42	case Instruction::MUL_FLOAT_2ADDR:
				43	case Instruction::MUL_FLOAT:
				44	op = kX86MulssRR;
				45	break;
				46	case Instruction::NEG_FLOAT:
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	47	// TODO: Make this nicer. Subtracting the source from 0 doesn't work in
				48	// the 0 case, and using FCHS is difficult with register promotion. This
				49	// code treats the value as a CoreReg to make it easy to manipulate.
				50	rlSrc1 = loadValue(cUnit, rlSrc1, kCoreReg);
				51	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
				52	opRegRegImm(cUnit, kOpAdd, rlResult.lowReg, rlSrc1.lowReg, 0x80000000);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	53	storeValue(cUnit, rlDest, rlResult);
				54	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	55	case Instruction::REM_FLOAT_2ADDR:
				56	case Instruction::REM_FLOAT: {
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	57	return genArithOpFloatPortable(cUnit, opcode, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	58	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	59	default:
				60	return true;
				61	}
				62	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				63	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				64	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				65	int rDest = rlResult.lowReg;
				66	int rSrc1 = rlSrc1.lowReg;
				67	int rSrc2 = rlSrc2.lowReg;
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	68	if (rSrc2 == rDest) {
				69	rSrc2 = oatAllocTempFloat(cUnit);
				70	opRegCopy(cUnit, rSrc2, rDest);
				71	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	72	opRegCopy(cUnit, rDest, rSrc1);
				73	newLIR2(cUnit, op, rDest, rSrc2);
				74	storeValue(cUnit, rlDest, rlResult);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	75
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	76	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	77	}
				78
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	79	static bool genArithOpDouble(CompilationUnit *cUnit, Instruction::Code opcode,
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	80	RegLocation rlDest, RegLocation rlSrc1,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	81	RegLocation rlSrc2) {
				82	X86OpCode op = kX86Nop;
				83	RegLocation rlResult;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	84
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	85	switch (opcode) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	86	case Instruction::ADD_DOUBLE_2ADDR:
				87	case Instruction::ADD_DOUBLE:
				88	op = kX86AddsdRR;
				89	break;
				90	case Instruction::SUB_DOUBLE_2ADDR:
				91	case Instruction::SUB_DOUBLE:
				92	op = kX86SubsdRR;
				93	break;
				94	case Instruction::DIV_DOUBLE_2ADDR:
				95	case Instruction::DIV_DOUBLE:
				96	op = kX86DivsdRR;
				97	break;
				98	case Instruction::MUL_DOUBLE_2ADDR:
				99	case Instruction::MUL_DOUBLE:
				100	op = kX86MulsdRR;
				101	break;
				102	case Instruction::NEG_DOUBLE:
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	103	// TODO: Make this nicer. Subtracting the source from 0 doesn't work in
				104	// the 0 case, and using FCHS is difficult with register promotion. This
				105	// code treats the value as a CoreReg to make it easy to manipulate.
				106	rlSrc1 = loadValueWide(cUnit, rlSrc1, kCoreReg);
				107	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
				108	opRegRegImm(cUnit, kOpAdd, rlResult.highReg, rlSrc1.highReg, 0x80000000);
				109	opRegCopy(cUnit, rlResult.lowReg, rlSrc1.lowReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	110	storeValueWide(cUnit, rlDest, rlResult);
				111	return false;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	112	case Instruction::REM_DOUBLE_2ADDR:
				113	case Instruction::REM_DOUBLE: {
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	114	return genArithOpDoublePortable(cUnit, opcode, rlDest, rlSrc1, rlSrc2);
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	115	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	116	default:
				117	return true;
				118	}
				119	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				120	DCHECK(rlSrc1.wide);
				121	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				122	DCHECK(rlSrc2.wide);
				123	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				124	DCHECK(rlDest.wide);
				125	DCHECK(rlResult.wide);
				126	int rDest = S2D(rlResult.lowReg, rlResult.highReg);
				127	int rSrc1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
				128	int rSrc2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	129	if (rDest == rSrc2) {
				130	rSrc2 = oatAllocTempDouble(cUnit) \| FP_DOUBLE;
				131	opRegCopy(cUnit, rSrc2, rDest);
				132	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	133	opRegCopy(cUnit, rDest, rSrc1);
				134	newLIR2(cUnit, op, rDest, rSrc2);
				135	storeValueWide(cUnit, rlDest, rlResult);
				136	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	137	}
				138
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	139	static bool genConversion(CompilationUnit *cUnit, Instruction::Code opcode,
				140	RegLocation rlDest, RegLocation rlSrc) {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	141	RegisterClass rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	142	X86OpCode op = kX86Nop;
				143	int srcReg;
				144	RegLocation rlResult;
				145	switch (opcode) {
				146	case Instruction::INT_TO_FLOAT:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	147	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	148	op = kX86Cvtsi2ssRR;
				149	break;
				150	case Instruction::DOUBLE_TO_FLOAT:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	151	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	152	op = kX86Cvtsd2ssRR;
				153	break;
				154	case Instruction::FLOAT_TO_DOUBLE:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	155	rcSrc = kFPReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	156	op = kX86Cvtss2sdRR;
				157	break;
				158	case Instruction::INT_TO_DOUBLE:
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	159	rcSrc = kCoreReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	160	op = kX86Cvtsi2sdRR;
				161	break;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	162	case Instruction::FLOAT_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	163	rlSrc = loadValue(cUnit, rlSrc, kFPReg);
				164	srcReg = rlSrc.lowReg;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	165	oatClobberSReg(cUnit, rlDest.sRegLow);
				166	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	167	int tempReg = oatAllocTempFloat(cUnit);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	168
				169	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				170	newLIR2(cUnit, kX86Cvtsi2ssRR, tempReg, rlResult.lowReg);
				171	newLIR2(cUnit, kX86ComissRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	172	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				173	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				174	newLIR2(cUnit, kX86Cvttss2siRR, rlResult.lowReg, srcReg);
				175	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				176	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				177	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				178	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				179	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	180	storeValue(cUnit, rlDest, rlResult);
				181	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	182	}
				183	case Instruction::DOUBLE_TO_INT: {
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	184	rlSrc = loadValueWide(cUnit, rlSrc, kFPReg);
				185	srcReg = rlSrc.lowReg;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	186	oatClobberSReg(cUnit, rlDest.sRegLow);
				187	rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
jeffhao	4abb1a9	2012-06-08 17:02:08 -0700	[diff] [blame]	188	int tempReg = oatAllocTempDouble(cUnit) \| FP_DOUBLE;
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	189
				190	loadConstant(cUnit, rlResult.lowReg, 0x7fffffff);
				191	newLIR2(cUnit, kX86Cvtsi2sdRR, tempReg, rlResult.lowReg);
				192	newLIR2(cUnit, kX86ComisdRR, srcReg, tempReg);
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	193	LIR* branchPosOverflow = newLIR2(cUnit, kX86Jcc8, 0, kX86CondA);
				194	LIR* branchNaN = newLIR2(cUnit, kX86Jcc8, 0, kX86CondP);
				195	newLIR2(cUnit, kX86Cvttsd2siRR, rlResult.lowReg, srcReg);
				196	LIR* branchNormal = newLIR1(cUnit, kX86Jmp8, 0);
				197	branchNaN->target = newLIR0(cUnit, kPseudoTargetLabel);
				198	newLIR2(cUnit, kX86Xor32RR, rlResult.lowReg, rlResult.lowReg);
				199	branchPosOverflow->target = newLIR0(cUnit, kPseudoTargetLabel);
				200	branchNormal->target = newLIR0(cUnit, kPseudoTargetLabel);
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	201	storeValue(cUnit, rlDest, rlResult);
				202	return false;
jeffhao	292188d	2012-05-17 15:45:04 -0700	[diff] [blame]	203	}
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	204	case Instruction::LONG_TO_DOUBLE:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	205	case Instruction::LONG_TO_FLOAT:
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	206	// These can be implemented inline by using memory as a 64-bit source.
				207	// However, this can't be done easily if the register has been promoted.
				208	UNIMPLEMENTED(WARNING) << "inline l2[df] " << PrettyMethod(cUnit->method_idx, *cUnit->dex_file);
				209	case Instruction::FLOAT_TO_LONG:
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	210	case Instruction::DOUBLE_TO_LONG:
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	211	return genConversionPortable(cUnit, opcode, rlDest, rlSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	212	default:
				213	return true;
				214	}
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	215	if (rlSrc.wide) {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	216	rlSrc = loadValueWide(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	217	srcReg = S2D(rlSrc.lowReg, rlSrc.highReg);
				218	} else {
jeffhao	5121e0b	2012-05-08 18:23:38 -0700	[diff] [blame]	219	rlSrc = loadValue(cUnit, rlSrc, rcSrc);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	220	srcReg = rlSrc.lowReg;
				221	}
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	222	if (rlDest.wide) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	223	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				224	newLIR2(cUnit, op, S2D(rlResult.lowReg, rlResult.highReg), srcReg);
				225	storeValueWide(cUnit, rlDest, rlResult);
				226	} else {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	227	rlResult = oatEvalLoc(cUnit, rlDest, kFPReg, true);
				228	newLIR2(cUnit, op, rlResult.lowReg, srcReg);
				229	storeValue(cUnit, rlDest, rlResult);
				230	}
				231	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	232	}
				233
buzbee	408ad16	2012-06-06 16:45:18 -0700	[diff] [blame]	234	static bool genCmpFP(CompilationUnit *cUnit, Instruction::Code code, RegLocation rlDest,
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	235	RegLocation rlSrc1, RegLocation rlSrc2) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	236	bool single = (code == Instruction::CMPL_FLOAT) \|\| (code == Instruction::CMPG_FLOAT);
				237	bool unorderedGt = (code == Instruction::CMPG_DOUBLE) \|\| (code == Instruction::CMPG_FLOAT);
				238	int srcReg1;
				239	int srcReg2;
				240	if (single) {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	241	rlSrc1 = loadValue(cUnit, rlSrc1, kFPReg);
				242	srcReg1 = rlSrc1.lowReg;
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	243	rlSrc2 = loadValue(cUnit, rlSrc2, kFPReg);
				244	srcReg2 = rlSrc2.lowReg;
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	245	} else {
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	246	rlSrc1 = loadValueWide(cUnit, rlSrc1, kFPReg);
				247	srcReg1 = S2D(rlSrc1.lowReg, rlSrc1.highReg);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	248	rlSrc2 = loadValueWide(cUnit, rlSrc2, kFPReg);
				249	srcReg2 = S2D(rlSrc2.lowReg, rlSrc2.highReg);
				250	}
jeffhao	41005dd	2012-05-09 17:58:52 -0700	[diff] [blame]	251	oatClobberSReg(cUnit, rlDest.sRegLow);
Ian Rogers	c6f3bb8	2012-03-21 20:40:33 -0700	[diff] [blame]	252	RegLocation rlResult = oatEvalLoc(cUnit, rlDest, kCoreReg, true);
				253	loadConstantNoClobber(cUnit, rlResult.lowReg, unorderedGt ? 1 : 0);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	254	if (single) {
				255	newLIR2(cUnit, kX86UcomissRR, srcReg1, srcReg2);
				256	} else {
				257	newLIR2(cUnit, kX86UcomisdRR, srcReg1, srcReg2);
				258	}
				259	LIR* branch = NULL;
				260	if (unorderedGt) {
Ian Rogers	b41b33b	2012-03-20 14:22:54 -0700	[diff] [blame]	261	branch = newLIR2(cUnit, kX86Jcc8, 0, kX86CondPE);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	262	}
				263	newLIR2(cUnit, kX86Set8R, rlResult.lowReg, kX86CondA /* above - unsigned > */);
				264	newLIR2(cUnit, kX86Sbb32RI, rlResult.lowReg, 0);
				265	if (unorderedGt) {
				266	branch->target = newLIR0(cUnit, kPseudoTargetLabel);
				267	}
jeffhao	644d531	2012-05-03 19:04:49 -0700	[diff] [blame]	268	storeValue(cUnit, rlDest, rlResult);
Ian Rogers	b5d09b2	2012-03-06 22:14:17 -0800	[diff] [blame]	269	return false;
buzbee	e88dfbf	2012-03-05 11:19:57 -0800	[diff] [blame]	270	}
				271
				272	} // namespace art