j2kun
diff --git a/‎.gitignore‎
Lines changed: 1 addition & 1 deletion b/‎.gitignore‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎lib/CMakeLists.txt‎
Lines changed: 2 additions & 1 deletion b/‎lib/CMakeLists.txt‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎lib/Conversion/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎lib/Conversion/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎lib/Conversion/PolyToStandard/BUILD‎
Lines changed: 42 additions & 0 deletions b/‎lib/Conversion/PolyToStandard/BUILD‎
Lines changed: 42 additions & 0 deletions
diff --git a/‎lib/Conversion/PolyToStandard/CMakeLists.txt‎
Lines changed: 29 additions & 0 deletions b/‎lib/Conversion/PolyToStandard/CMakeLists.txt‎
Lines changed: 29 additions & 0 deletions
diff --git a/‎lib/Conversion/PolyToStandard/PolyToStandard.cpp‎
Lines changed: 299 additions & 0 deletions b/‎lib/Conversion/PolyToStandard/PolyToStandard.cpp‎
Lines changed: 299 additions & 0 deletions
@@ -19,4 +19,4 @@ externals
 /CMakeSettings.json
 # Compilation databases
 compile_commands.json
-tablegen_compile_commands.yml
+tablegen_compile_commands.yml
@@ -1,2 +1,3 @@
 add_subdirectory(Dialect)
-add_subdirectory(Transform)
+add_subdirectory(Conversion)
+add_subdirectory(Transform)
@@ -0,0 +1 @@
+add_subdirectory(PolyToStandard)
@@ -0,0 +1,42 @@
+load("@llvm-project//mlir:tblgen.bzl", "gentbl_cc_library")
+
+package(
+    default_visibility = ["//visibility:public"],
+)
+
+gentbl_cc_library(
+    name = "pass_inc_gen",
+    tbl_outs = [
+        (
+            [
+                "-gen-pass-decls",
+                "-name=PolyToStandard",
+            ],
+            "PolyToStandard.h.inc",
+        ),
+    ],
+    tblgen = "@llvm-project//mlir:mlir-tblgen",
+    td_file = "PolyToStandard.td",
+    deps = [
+        "@llvm-project//mlir:OpBaseTdFiles",
+        "@llvm-project//mlir:PassBaseTdFiles",
+    ],
+)
+
+cc_library(
+    name = "PolyToStandard",
+    srcs = ["PolyToStandard.cpp"],
+    hdrs = ["PolyToStandard.h"],
+    deps = [
+        "pass_inc_gen",
+        "//lib/Dialect/Poly",
+        "@llvm-project//mlir:ArithDialect",
+        "@llvm-project//mlir:FuncDialect",
+        "@llvm-project//mlir:FuncTransforms",
+        "@llvm-project//mlir:IR",
+        "@llvm-project//mlir:Pass",
+        "@llvm-project//mlir:SCFDialect",
+        "@llvm-project//mlir:TensorDialect",
+        "@llvm-project//mlir:Transforms",
+    ],
+)
@@ -0,0 +1,29 @@
+add_mlir_library(PolyToStandard
+  PolyToStandard.cpp
+
+  ${PROJECT_SOURCE_DIR}/lib/Conversion/PolyToStandard/
+  ADDITIONAL_HEADER_DIRS
+
+  DEPENDS
+  PolyToStandardPassIncGen
+
+  LINK_COMPONENTS
+  Core
+
+  LINK_LIBS PUBLIC
+  MLIRPoly
+  MLIRArithDialect
+  MLIRFuncDialect
+  MLIRFuncTransforms
+  MLIRIR
+  MLIRPass
+  MLIRSCFDialect
+  MLIRTensorDialect
+  MLIRTransforms
+  )
+
+set(LLVM_TARGET_DEFINITIONS PolyToStandard.td)
+mlir_tablegen(PolyToStandard.h.inc -gen-pass-decls -name PolyToStandard)
+add_dependencies(mlir-headers MLIRPolyOpsIncGen)
+add_public_tablegen_target(PolyToStandardPassIncGen)
+add_mlir_doc(PolyToStandard PolyToStandard PolyToStandard/ -gen-pass-doc)
@@ -0,0 +1,299 @@
+#include "lib/Conversion/PolyToStandard/PolyToStandard.h"
+
+#include "lib/Dialect/Poly/PolyOps.h"
+#include "lib/Dialect/Poly/PolyTypes.h"
+#include "llvm/include/llvm/ADT/SmallVector.h"          // from @llvm-project
+#include "mlir/Dialect/SCF/IR/SCF.h"                    // from @llvm-project
+#include "mlir/include/mlir/Dialect/Func/IR/FuncOps.h"  // from @llvm-project
+#include "mlir/include/mlir/Dialect/Func/Transforms/FuncConversions.h"  // from @llvm-project
+#include "mlir/include/mlir/IR/ImplicitLocOpBuilder.h"  // from @llvm-project
+#include "mlir/include/mlir/Transforms/DialectConversion.h"  // from @llvm-project
+
+namespace mlir {
+namespace tutorial {
+namespace poly {
+
+#define GEN_PASS_DEF_POLYTOSTANDARD
+#include "lib/Conversion/PolyToStandard/PolyToStandard.h.inc"
+
+class PolyToStandardTypeConverter : public TypeConverter {
+ public:
+  PolyToStandardTypeConverter(MLIRContext *ctx) {
+    addConversion([](Type type) { return type; });
+    addConversion([ctx](PolynomialType type) -> Type {
+      int degreeBound = type.getDegreeBound();
+      IntegerType elementTy =
+          IntegerType::get(ctx, 32, IntegerType::SignednessSemantics::Signless);
+      return RankedTensorType::get({degreeBound}, elementTy);
+    });
+
+    // We don't include any custom materialization hooks because this lowering
+    // is all done in a single pass. The dialect conversion framework works by
+    // resolving intermediate (mid-pass) type conflicts by inserting
+    // unrealized_conversion_cast ops, and only converting those to custom
+    // materializations if they persist at the end of the pass. In our case,
+    // we'd only need to use custom materializations if we split this lowering
+    // across multiple passes.
+  }
+};
+
+struct ConvertAdd : public OpConversionPattern<AddOp> {
+  ConvertAdd(mlir::MLIRContext *context)
+      : OpConversionPattern<AddOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      AddOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    arith::AddIOp addOp = rewriter.create<arith::AddIOp>(
+        op.getLoc(), adaptor.getLhs(), adaptor.getRhs());
+    rewriter.replaceOp(op.getOperation(), {addOp});
+    return success();
+  }
+};
+
+struct ConvertSub : public OpConversionPattern<SubOp> {
+  ConvertSub(mlir::MLIRContext *context)
+      : OpConversionPattern<SubOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      SubOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    arith::SubIOp subOp = rewriter.create<arith::SubIOp>(
+        op.getLoc(), adaptor.getLhs(), adaptor.getRhs());
+    rewriter.replaceOp(op.getOperation(), {subOp});
+    return success();
+  }
+};
+
+struct ConvertMul : public OpConversionPattern<MulOp> {
+  ConvertMul(mlir::MLIRContext *context)
+      : OpConversionPattern<MulOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      MulOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    auto polymulTensorType = cast<RankedTensorType>(adaptor.getLhs().getType());
+    auto numTerms = polymulTensorType.getShape()[0];
+    ImplicitLocOpBuilder b(op.getLoc(), rewriter);
+
+    // Create an all-zeros tensor to store the result
+    auto polymulResult = b.create<arith::ConstantOp>(
+        polymulTensorType, DenseElementsAttr::get(polymulTensorType, 0));
+
+    // Loop bounds and step.
+    auto lowerBound =
+        b.create<arith::ConstantOp>(b.getIndexType(), b.getIndexAttr(0));
+    auto numTermsOp =
+        b.create<arith::ConstantOp>(b.getIndexType(), b.getIndexAttr(numTerms));
+    auto step =
+        b.create<arith::ConstantOp>(b.getIndexType(), b.getIndexAttr(1));
+
+    auto p0 = adaptor.getLhs();
+    auto p1 = adaptor.getRhs();
+
+    // for i = 0, ..., N-1
+    //   for j = 0, ..., N-1
+    //     product[i+j (mod N)] += p0[i] * p1[j]
+    auto outerLoop = b.create<scf::ForOp>(
+        lowerBound, numTermsOp, step, ValueRange(polymulResult.getResult()),
+        [&](OpBuilder &builder, Location loc, Value p0Index,
+            ValueRange loopState) {
+          ImplicitLocOpBuilder b(op.getLoc(), builder);
+          auto innerLoop = b.create<scf::ForOp>(
+              lowerBound, numTermsOp, step, loopState,
+              [&](OpBuilder &builder, Location loc, Value p1Index,
+                  ValueRange loopState) {
+                ImplicitLocOpBuilder b(op.getLoc(), builder);
+                auto accumTensor = loopState.front();
+                auto destIndex = b.create<arith::RemUIOp>(
+                    b.create<arith::AddIOp>(p0Index, p1Index), numTermsOp);
+                auto mulOp = b.create<arith::MulIOp>(
+                    b.create<tensor::ExtractOp>(p0, ValueRange(p0Index)),
+                    b.create<tensor::ExtractOp>(p1, ValueRange(p1Index)));
+                auto result = b.create<arith::AddIOp>(
+                    mulOp, b.create<tensor::ExtractOp>(accumTensor,
+                                                       destIndex.getResult()));
+                auto stored = b.create<tensor::InsertOp>(result, accumTensor,
+                                                         destIndex.getResult());
+                b.create<scf::YieldOp>(stored.getResult());
+              });
+
+          b.create<scf::YieldOp>(innerLoop.getResults());
+        });
+
+    rewriter.replaceOp(op, outerLoop.getResult(0));
+    return success();
+  }
+};
+
+struct ConvertEval : public OpConversionPattern<EvalOp> {
+  ConvertEval(mlir::MLIRContext *context)
+      : OpConversionPattern<EvalOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      EvalOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    auto polyTensorType =
+        cast<RankedTensorType>(adaptor.getPolynomial().getType());
+    auto numTerms = polyTensorType.getShape()[0];
+    ImplicitLocOpBuilder b(op.getLoc(), rewriter);
+
+    auto lowerBound =
+        b.create<arith::ConstantOp>(b.getIndexType(), b.getIndexAttr(1));
+    auto numTermsOp = b.create<arith::ConstantOp>(b.getIndexType(),
+                                                  b.getIndexAttr(numTerms + 1));
+    auto step = lowerBound;
+
+    auto poly = adaptor.getPolynomial();
+    auto point = adaptor.getPoint();
+
+    // Horner's method:
+    //
+    // accum = 0
+    // for i = 1, 2, ..., N
+    //   accum = point * accum + coeff[N - i]
+    auto accum =
+        b.create<arith::ConstantOp>(b.getI32Type(), b.getI32IntegerAttr(0));
+    auto loop = b.create<scf::ForOp>(
+        lowerBound, numTermsOp, step, accum.getResult(),
+        [&](OpBuilder &builder, Location loc, Value loopIndex,
+            ValueRange loopState) {
+          ImplicitLocOpBuilder b(op.getLoc(), builder);
+          auto accum = loopState.front();
+          auto coeffIndex = b.create<arith::SubIOp>(numTermsOp, loopIndex);
+          auto mulOp = b.create<arith::MulIOp>(point, accum);
+          auto result = b.create<arith::AddIOp>(
+              mulOp, b.create<tensor::ExtractOp>(poly, coeffIndex.getResult()));
+          b.create<scf::YieldOp>(result.getResult());
+        });
+
+    rewriter.replaceOp(op, loop.getResult(0));
+    return success();
+  }
+};
+
+struct ConvertFromTensor : public OpConversionPattern<FromTensorOp> {
+  ConvertFromTensor(mlir::MLIRContext *context)
+      : OpConversionPattern<FromTensorOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      FromTensorOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    auto resultTensorTy = cast<RankedTensorType>(
+        typeConverter->convertType(op->getResultTypes()[0]));
+    auto resultShape = resultTensorTy.getShape()[0];
+    auto resultEltTy = resultTensorTy.getElementType();
+
+    auto inputTensorTy = op.getInput().getType();
+    auto inputShape = inputTensorTy.getShape()[0];
+
+    // Zero pad the tensor if the coefficients' size is less than the polynomial
+    // degree.
+    ImplicitLocOpBuilder b(op.getLoc(), rewriter);
+    auto coeffValue = adaptor.getInput();
+    if (inputShape < resultShape) {
+      SmallVector<OpFoldResult, 1> low, high;
+      low.push_back(rewriter.getIndexAttr(0));
+      high.push_back(rewriter.getIndexAttr(resultShape - inputShape));
+      coeffValue = b.create<tensor::PadOp>(
+          resultTensorTy, coeffValue, low, high,
+          b.create<arith::ConstantOp>(rewriter.getIntegerAttr(resultEltTy, 0)),
+          /*nofold=*/false);
+    }
+
+    rewriter.replaceOp(op, coeffValue);
+    return success();
+  }
+};
+
+struct ConvertToTensor : public OpConversionPattern<ToTensorOp> {
+  ConvertToTensor(mlir::MLIRContext *context)
+      : OpConversionPattern<ToTensorOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      ToTensorOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    rewriter.replaceOp(op, adaptor.getInput());
+    return success();
+  }
+};
+
+struct ConvertConstant : public OpConversionPattern<ConstantOp> {
+  ConvertConstant(mlir::MLIRContext *context)
+      : OpConversionPattern<ConstantOp>(context) {}
+
+  using OpConversionPattern::OpConversionPattern;
+
+  LogicalResult matchAndRewrite(
+      ConstantOp op, OpAdaptor adaptor,
+      ConversionPatternRewriter &rewriter) const override {
+    ImplicitLocOpBuilder b(op.getLoc(), rewriter);
+    auto constOp = b.create<arith::ConstantOp>(adaptor.getCoefficients());
+    auto fromTensorOp =
+        b.create<FromTensorOp>(op.getResult().getType(), constOp);
+    rewriter.replaceOp(op, fromTensorOp.getResult());
+    return success();
+  }
+};
+
+struct PolyToStandard : impl::PolyToStandardBase<PolyToStandard> {
+  using PolyToStandardBase::PolyToStandardBase;
+
+  void runOnOperation() override {
+    MLIRContext *context = &getContext();
+    auto *module = getOperation();
+
+    ConversionTarget target(*context);
+    target.addLegalDialect<arith::ArithDialect>();
+    target.addIllegalDialect<PolyDialect>();
+
+    RewritePatternSet patterns(context);
+    PolyToStandardTypeConverter typeConverter(context);
+    patterns.add<ConvertAdd, ConvertConstant, ConvertSub, ConvertEval,
+                 ConvertMul, ConvertFromTensor, ConvertToTensor>(typeConverter,
+                                                                 context);
+
+    populateFunctionOpInterfaceTypeConversionPattern<func::FuncOp>(
+        patterns, typeConverter);
+    target.addDynamicallyLegalOp<func::FuncOp>([&](func::FuncOp op) {
+      return typeConverter.isSignatureLegal(op.getFunctionType()) &&
+             typeConverter.isLegal(&op.getBody());
+    });
+
+    populateReturnOpTypeConversionPattern(patterns, typeConverter);
+    target.addDynamicallyLegalOp<func::ReturnOp>(
+        [&](func::ReturnOp op) { return typeConverter.isLegal(op); });
+
+    populateCallOpTypeConversionPattern(patterns, typeConverter);
+    target.addDynamicallyLegalOp<func::CallOp>(
+        [&](func::CallOp op) { return typeConverter.isLegal(op); });
+
+    populateBranchOpInterfaceTypeConversionPattern(patterns, typeConverter);
+    target.markUnknownOpDynamicallyLegal([&](Operation *op) {
+      return isNotBranchOpInterfaceOrReturnLikeOp(op) ||
+             isLegalForBranchOpInterfaceTypeConversionPattern(op,
+                                                              typeConverter) ||
+             isLegalForReturnOpTypeConversionPattern(op, typeConverter);
+    });
+
+    if (failed(applyPartialConversion(module, target, std::move(patterns)))) {
+      signalPassFailure();
+    }
+  }
+};
+
+}  // namespace poly
+}  // namespace tutorial
+}  // namespace mlir